Korpusgrundlage

Die lexikalische Datenbank dlexDB hat als Korpusgrundlage das Kernkorpus des Digitalen Wörterbuchs der deutschen Sprache (DWDS). Das Kernkorpus des DWDS ist ein zeitlich und nach Textsorten ausgewogenes Referenzkorpus der deutschen Sprache des 20. Jahrhunderts und hat in seiner Online-Version folgende Zusammensetzung:

  • Belletristik ca. 28%
  • Zeitung ca. 27%
  • Wissenschaft ca. 23%
  • Gebrauchsliteratur ca. 21%

Das Kernkorpus des DWDS hat einen Umfang von ca. 100 Millionen laufenden Textwörtern (Tokens). Die Anzahl der verschiedenen Wörter (Types) beträgt ca. 2,3 Millionen.

Detaillierte Informationen über das DWDS-Kernkorpus finden Sie hier.