dlex

Kumulierte Zeichenbigramme-Korpusfrequenz

Die Summer der Häufigkeit aller (Zeichen-)Bigramme, die ein Type enthält, im Korpus.

Beispiel: Type Hans

Dabei ist $ ein Platzhalter für den Anfang bzw. das Ende eines Wortes.

Datentyp

Korpusfrequenz

Untertypen

absolut, normalisiert, absolut log₁₀, normalisiert log₁₀, Frequenzrang, Frequenzrang 123

Basis für die Normalisierung

pro Million Tokens (pro Million laufende Wörter im Korpus)

Abfrageoperatoren

größer oder gleich, kleiner oder gleich

Nullwert

-1

In folgenden N-Gramm-Tabellen können Sie den Filter auf jede einzelne Komponente anwenden: