Wie viele Wörter hat die deutsche Sprache?
Autor: Silvan Maaß
Stellt euch vor, ihr müsstet alle deutschen Wörter zählen. Wo würdet ihr beginnen - und wichtiger noch: wo würdet ihr aufhören? Erschwerend kommt hinzu, dass die deutsche Sprache vor einem faszinierenden lexikalischen Paradox steht. Denn theoretisch verfügt sie über einen nahezu unbegrenzten Wortschatz. Die Frage nach der exakten Anzahl deutscher Wörter gleicht daher der Suche nach dem Ende des Universums.
Begebt euch im Folgenden auf eine Reise in die sprachliche Unendlichkeit, die Linguisten vor einzigartige Herausforderungen stellt und tiefe Einblicke in das Wesen unserer Kommunikation gewährt.
INHALTSVERZEICHNIS
- Umfang des deutschen Wortschatzes
- Aktive und passive Wortschatzgrößen
- Historische Entwicklung des deutschen Wortschatzes
- Sprachwandel und lexikalische Dynamik
- Methodische Herausforderungen der Wortschatzerfassung
- Die Rolle digitaler Korpora
- Lexikalische Ressourcen und ihre Limitationen
- Abschließende Worte
Umfang des deutschen Wortschatzes
Der deutsche Wortschatz ist beeindruckend vielfältig. Aber wie viele Wörter hat die deutsche Sprache denn nun? Gibt es hierauf eine verlässliche Antwort? Eigentlich nicht. Es gibt nur Annäherungswerte. Da sich sich der Wortschatz ständig weiterentwickelt, ist eine endgültige Zählung praktisch unmöglich.
Unterschiedliche Zahlen
Aktuelle Schätzungen gehen von etwa 300.000 bis 500.000 Wörtern aus, die die deutsche Gegenwartssprache enthält. Gleichzeitig erfassen digitale Zusammenstellungen wie das Dudenkorpus über 20 Millionen Grundformen und etwa sieben Milliarden Wortformen. Die aktuelle Ausgabe des gedruckten Duden (29. Auflage vom 20.08.2024) verzeichnet sogar "nur" 151.000 Stichwörter.
Die Zahlendiskrepanz erklärt
Die mit 151.000 Einträgen vergleichsweise niedrige Wortanzahl des gedruckten Duden ist allein schon durch das Buchformat begrenzt. Denn die Redaktion muss eine sorgfältige Auswahl treffen, welche Wörter aufgenommen werden und welche nicht. Dabei konzentriert man sich auf gebräuchliche Alltagswörter, wichtige Fachbegriffe und neue Wörter, die sich im Sprachgebrauch etabliert haben.
Die enorme Diskrepanz zwischen den geschätzten 300.000 - 500.000 Wörtern der deutschen Gegenwartssprache und den über 20 Millionen Grundformen im Dudenkorpus lässt sich auch erklären. Während in die Gegenwartssprache nur solche Wörter Einzug finden, die in einer bestimmten Häufigkeit und über einen bestimmten Zeitraum verwendet werden, kommen im Dudenkorpus weit mehr Wörter vor. Die umfangreiche digitale Textsammlung, die von der Dudenredaktion zur Erforschung und Dokumentation der deutschen Sprache erstellt und gepflegt wird, enthält über 20 Millionen Grundformen aus verschiedensten Quellen. Dazu zählen u.a. alte Wörter (Archaismen), nur selten verwendete Wörter, regionale Ausdrücke, neue Wortschöpfungen (Neologismen) sowie Fachbegriffe. Verschiedenste Wortzusammensetzungen - sogenannte Komposita (z. B. Eierschalensollbruchstellenverursacher) - "blähen" den Umfang des Dudenkorpus zusätzlich auf.
Hinweis: Hier findet ihr noch mehr Informationen zum Thema lexikalische Ressourcen und ihre Limitationen.
Aktive und passive Wortschatzgrößen
Während der Gesamtwortschatz der deutschen Sprache in die Millionen geht, beschränkt sich der aktive Wortschatz eines erwachsenen Muttersprachlers auf 12.000 bis 16.000 Wörter. Etwa 3.500 dieser Wörter sind Fremdwörter. Die Werte können je nach Bildung, Beruf und persönlichen Interessen natürlich variieren.
Der passive Wortschatz eines Erwachsenen liegt bei etwa 50.000 Wörtern.
Die Diskrepanz der beiden Wortschatzgrößen erklärt, warum selbst gebildete Sprecher viele Fachbegriffe oder Archaismen zwar kennen aber nicht aktiv verwenden.
Anzumerken ist noch, dass der Wortschatz eines Kindes naturgemäß viel kleiner ausfällt.
Zum Vergleich: William Shakespeare, der Meister der englischen Sprache, kam in seinen Werken auf "nur" 29.000 Wörter.
Goethes Sprachgewalt war also dreimal so groß. Ein beeindruckendes Zeugnis seiner Kreativität und Vielseitigkeit!
Historische Entwicklung des deutschen Wortschatzes
Die systematische Erfassung des deutschen Wortschatzes begann im 18. Jahrhundert mit Johann Christoph Adelungs "Grammatisch-kritisches Wörterbuch der Hochdeutschen Mundart", das 1774 erstmals erschien und etwa 58.000 Einträge umfasste. Ab 1838 erweiterten die Brüder Grimm diesen Bestand im "Deutschen Wörterbuch" auf rund 320.000 Stichwörter. Bis 1961 erschienen insgesamt 16 Bände dieses Wörterbuches.
Jene historischen Werke bildeten die Grundlage für moderne lexikalische Projekte wie z. B. das "Digitale Wörterbuch der deutschen Sprache (DWDS)" oder den "Duden".
Der quantitative Sprung von Adelungs 58.000 Wörtern zu den 320.000 Wörtern der Brüder Grimm illustriert nicht nur einen immensen Zuwachs, sondern auch den Einfluss digitaler Erfassungsmethoden. Zudem besitzt die deutsche Gegenwartssprache einen überaus reichen Wortschatz, der weit über gedruckte Lexika hinausgeht.
Sprachwandel und lexikalische Dynamik
Sprachlicher Wandel manifestiert sich im Verschwinden veralteter Begriffe und der Entstehung neuer Wörter. Dieser dynamische Prozess wird besonders durch gesellschaftliche Umbrüche, technologische Entwicklungen und kulturelle Veränderungen vorangetrieben. Die Digitalisierung hat beispielsweise eine Flut an Neologismen wie "liken", "googeln" oder "streamen" hervorgebracht, während Begriffe aus vordigitalen Zeiten wie "Telefax" oder "Tonbandgerät" zunehmend in Vergessenheit geraten.
Interessanterweise verschwinden Wörter selten vollständig, sondern verbleiben in Nischen wie der Literatur oder historischen Texten. Dies erklärt, warum die Referenzkorpora des DWDS sowohl zeitgenössische als auch historische Texte integrieren - nämlich um ein möglichst umfassendes Bild des Sprachgebrauchs zu gewährleisten.
Darüber hinaus führt die Globalisierung zu verstärktem Sprachkontakt und begünstigt die Übernahme von Lehnwörtern und Fremdausdrücken. Auch soziale Bewegungen prägen den Sprachwandel nachhaltig, indem sie neue Terminologien etablieren oder bestehende Begriffe umdeuten. Allerdings verläuft dieser Wandel nicht gleichmäßig in allen Bevölkerungsgruppen. Oft fungieren jüngere Generationen als Innovationstreiber, während ältere Sprachgemeinschaften häufig konservativere Sprachmuster beibehalten.
Die Geschwindigkeit des Sprachwandels hat sich im digitalen Zeitalter merklich erhöht, sodass Wörterbücher und Sprachinstitutionen kontinuierlich arbeiten müssen, um mit der rasanten Entwicklung Schritt zu halten.
Methodische Herausforderungen der Wortschatzerfassung
Die Erfassung des deutschen Wortschatzes steht vor zahlreichen methodischen Herausforderungen: Die hochproduktive Wortbildung, insbesondere bei Komposita, erlaubt theoretisch unbegrenzte Neubildungen, während die Existenz verschiedener Standardvarietäten in Deutschland, Österreich und der Schweiz sowie zahlreicher Dialekte die Definition eines einheitlichen Standardwortschatzes erschwert. Hinzu kommen die ständig wachsenden Fachterminologien, die teilweise in die Allgemeinsprache einfließen, sowie der rasante digitale Sprachwandel mit seiner Flut an Neologismen, deren Beständigkeit oft schwer einzuschätzen ist. Besondere Dokumentationsprobleme bereiten die flüchtigen Erscheinungsformen der Umgangssprache und Jugendsprache, während bei der Integration von Fremdwörtern Abgrenzungsfragen und orthografische Varianten (besonders bei Anglizismen) zusätzliche Komplexität schaffen. Bei korpusbasierten Erfassungsmethoden bestimmt zudem die Auswahl der Textkorpora maßgeblich, welche Wörter überhaupt ins Blickfeld der Lexikografie geraten. All diese Faktoren machen die Wortschatzerfassung im Deutschen zu einem niemals abgeschlossenen Prozess.
Die Rolle digitaler Korpora
Digitale Korpora haben die linguistische Forschung und lexikografische Arbeit im deutschen Sprachraum grundlegend transformiert. Als umfangreiche Sammlungen authentischer Sprachdaten ermöglichen sie empirisch fundierte Einblicke in den tatsächlichen Sprachgebrauch und haben damit die traditionelle - oft intuitionsbasierte - Sprachbetrachtung abgelöst. Das Dudenkorpus gilt mit seinen über 20 Millionen Grundformen als zentrale Ressource für die deutsche Sprachforschung.
Besonders wertvoll erweisen sich digitale Korpora für die Erfassung und Dokumentation des Sprachwandels. Neologismen, Bedeutungsverschiebungen und veränderte Verwendungsmuster lassen sich anhand von Frequenzanalysen und Kollokationsstudien präzise nachverfolgen. Die korpusbasierte Lexikografie profitiert dabei von der Möglichkeit, statistische Relevanzkriterien anzuwenden und Wörterbucheinträge mit authentischen Belegen zu untermauern.
Die zunehmende Diversifizierung digitaler Korpora – von spezialisierten Fachkorpora bis hin zu Sammlungen von Social-Media-Texten – erweitert das Spektrum erfassbarer Sprachvarietäten erheblich. Dies ermöglicht differenziertere Untersuchungen zu regionalen Unterschieden, fachsprachlichen Besonderheiten und sprachlichen Innovationen in verschiedenen Kommunikationsformen. Moderne computerlinguistische Methoden wie maschinelles Lernen oder gar künstliche Intelligenz eröffnen zudem neue Analysemöglichkeiten, die manuell kaum zu bewältigen wären.
Trotz ihrer immensen Bedeutung stehen digitale Korpora vor methodischen Herausforderungen: Fragen der Repräsentativität, des Copyrights und der angemessenen Annotation bleiben zentrale Diskussionspunkte. Zudem erfordert die sinnvolle Interpretation korpuslinguistischer Daten nach wie vor linguistisches Fachwissen und interpretative Kompetenz. In der Zukunft dürften multimodale Korpora, die neben geschriebener Sprache auch gesprochene Sprache, Gestik und weitere kommunikative Ressourcen erfassen, das Verständnis sprachlicher Praktiken weiter vertiefen.
Lexikalische Ressourcen und ihre Limitationen
Lexikalische Ressourcen wie Wörterbücher, Thesauri und Datenbanken bilden das Fundament linguistischer Forschung und sprachpraktischer Anwendungen im deutschen Sprachraum. Dennoch unterliegen sämtliche Ressourcen inhärenten Beschränkungen, die ihre Vollständigkeit und Nutzbarkeit einschränken.
Der Rechtschreibduden mit 151.000 Einträgen (Stand 2024) dient vielen als Referenz für korrekte Schreibung und Grammatik. Allerdings bildet er nur einen Bruchteil des tatsächlichen Wortschatzes ab, da er bewusst auf Häufigkeit und Relevanz filtert. Im Kontrast dazu erfasst das digitale DWDS über 250.000 Wörter und verknüpft diese mit Textbeispielen und statistischen Daten.
Diese Zahlen verdeutlichen die fundamentale Diskrepanz zwischen gedruckten und digitalen lexikalischen Ressourcen. Während der Duden durch physische Begrenzungen zu rigoroser Selektion gezwungen ist, können digitale Systeme ein weitaus umfassenderes Bild des deutschen Wortschatzes zeichnen.
Eine zentrale Limitation ist zudem die unvermeidbare Diskrepanz zwischen lexikografischer Erfassung und Sprachwirklichkeit. Die außerordentliche Produktivität der deutschen Wortbildung, insbesondere bei Komposita, erzeugt kontinuierlich neue Wortformen, die in keinem Wörterbuch vollständig abbildbar sind. Der deutsche Grundwortschatz umfasst etwa 1.285 Wörter, während der gesamte Wortschatz in die Millionen geht.
Zeitliche Verzögerungen stellen ein weiteres Problem dar. Zwischen dem Aufkommen neuer Begriffe und ihrer lexikografischen Erfassung vergeht oft erhebliche Zeit – ein Prozess, der durch die beschleunigte Sprachentwicklung im digitalen Zeitalter zusätzlich herausgefordert wird. Neologismen aus Technologie, Biologie, Medizin, sozialen Medien und Jugendkulturen finden erst mit Verzögerung Eingang in standardisierte Ressourcen.
Methodologisch problematisch ist zudem die Abhängigkeit vom zugrundeliegenden Korpus. Die Selektion der Textquellen beeinflusst maßgeblich, welche Wörter und Verwendungsweisen überhaupt erfasst werden können. Informelle Register, Fachsprachen und bestimmte Textsorten sind in vielen Korpora unterrepräsentiert.
Trotz zunehmender Digitalisierung kämpfen lexikalische Ressourcen mit Problemen der Interoperabilität und Standardisierung. Unterschiedliche Annotationsschemata, Metadatenstrukturen und technische Formate erschweren die Vernetzung verschiedener Ressourcen, die für umfassende linguistische Analysen notwendig wäre.
Alle erwähnten Limitationen verdeutlichen, dass lexikalische Ressourcen stets als Annäherungen an die sprachliche Realität zu verstehen sind. Es sind wertvolle aber unvollständige Werkzeuge im fortlaufenden Prozess der Sprachdokumentation und -beschreibung.
Abschließende Worte
Der deutsche Wortschatz ist ein dynamisches und vielschichtiges Phänomen, dessen Umfang ständigen Schwankungen unterliegt. Während traditionelle Wörterbücher wie der Duden eine überschaubare Auswahl etablierter Begriffe dokumentieren, erfassen digitale Korpora die gesamte Breite des Sprachgebrauchs. Der aktive Wortschatz eines Einzelnen mag begrenzt sein, doch die kollektive lexikalische Vielfalt des Deutschen bleibt ein faszinierendes Spiegelbild kultureller und wissenschaftlicher Entwicklungen.

Über den Autor
Silvan Maaß ist Diplom-Kommunikationswirt (dab) sowie Mitbegründer der Sprachnudel, wodurch er sich seit 20 Jahren beinahe täglich mit theoretischer und angewandter Linguistik beschäftigt. Die Lebendigkeit der Sprache hat es ihm besonders angetan. Daher interessiert er sich insbesondere für Okkasionalismen und Neologismen - zwei kreative Themenfelder der Linguistikforschung, die in unserer Gesellschaft relevanter denn je sind.

- Kostenloses E-Book für Flüchtlinge aus der Ukraine

- Alles, was ihr zum Deutschlernen braucht – ausführliche Erklärungen, Tipps, Übungen und Ressourcen → Deutsch lernen
Wörter nach Anfangsbuchstabe


- Mit Hilfe der Wortsuche oder von unserem Wortfinder lassen sich Wörter nach bestimmten Mustern filtern.

- Nutzt unsere zahlreichen Wortlisten in unserem Wörterverzeichnis, um gezielt deutsche Wörter zu finden!
Statistiken
- Abkürzungen 5.243
- Adjektiv 14.452
- Dialekt 4.806
- Soziolekt 6.529
- Umgangssprache 3.749
- Nomen 108.632
- Verb 14.748
- Synonyme 1.515.628
- Neologismen 869
- Grüße 264
- Redewendungen 2.663
- Sprichwörter 1.489
- Sprüche 479
- Wünsche 468
- Zungenbrecher 447
- mehr Statistiken

- Geburtstagsüberraschung für Arbeitskollegen, Bekannte oder eure Liebsten gefällig? Probiert unsere Geburtstagsgrüße, Geburtstagssprüche und Geburtstagswünsche aus.
Beliebte Begriffe