Tabelle Types

Ein Textkorpus besteht aus Elementen wie Wörtern, Zahlen und Satzzeichen. Diese Elemente werden Tokens genannt. Orthographisch identische Tokens bezeichnet man als Instanzen ein und desselben Types. Die Types-Tabelle enthält alle Types, die zumindest einmal im zugrundeliegenden Korpus vorkommen. Bei Types wird wird zwischen Groß- und Kleinschriebung unterschieden, d.h. singt, Singt und SINGT sind drei verschiedene Types.

Die Types-Tabelle enthält Type-bezogene Informationen wie Frequenz, Familiarität, Regularität, Häufigkeit des Wortanfangs, Nachbarschaftsmaße und mehr.

dlexDB bietet auch Varianten dieser Maße an, die ohne Berücksichtigung von Groß-/Kleinschreibung berechnet wurden. Diese Maße sind ind der Types DC-Tabelle zu finden.

Auf der anderen Seite enthält die Annotierte Types-Tabelle noch spezifischere Frequenzmaße, nämlich die Häufigkeiten von Types unter Berücksichtigung der morphosyntaktischen Analyse im jeweiligen Kontext.

Die Types-Tabelle enthält folgende Spalten zur Anzeige oder Filterung: