Kumulierte Zeichenbigramme-Korpusfrequenz

Beschreibung:

Die Summer der Häufigkeit aller (Zeichen-)Bigramme, die ein Type enthält, im Korpus.

Beispiel: Type Hans

Häufigkeit im Korpus
$H1324760
Ha437363
an5291881
ns2218722
s$7962327
$Hans$17235053

Dabei ist $ ein Platzhalter für den Anfang bzw. das Ende eines Wortes.

Datentyp:

Datentyp
Korpusfrequenz
Untertypen
absolut, normalisiert, absolut log10, normalisiert log10, Frequenzrang, Frequenzrang 123
Basis für die Normalisierung
pro Million Tokens (pro Million laufende Wörter im Korpus)
Abfrageoperatoren
größer oder gleich, kleiner oder gleich
Nullwert
-1

In folgenden Tabellen vorhanden:

In folgenden N-Gramm-Tabellen können Sie den Filter auf jede einzelne Komponente anwenden: