Durchschn. bed. Wahrsch., bigrammbasiert
Beschreibung:
Durchschnittliche bedingte Wahrscheinlichkeit eines Types, betrachtet in Bigrammkontexten. Betrachtet werden alle Bigramme mit dem gegebenen Type als zweiter Komponente. Für jedes einzelne Bigramm kann die bedingte Wahrscheinlichkeit der zweiten Komponente als unmittelbarer Nachfolger der ersten Komponente angegeben werden mit:
P(w2|w1) = C(w1w2)/C(w1)
C steht für die absolute Häufigkeit eines Types bzw. eines Bigramms. Die durchschnittliche bedingte Wahrscheinlichkeit wird unter Berücksichtigung der Frequenz des jeweiligen Bigramms berechnet:
AvgCondProb = sum(C(w1w2)*P(w2|w1)) / sum(C(w1w2))
Die Summenbildung erfolgt für jeden Type über alle Bigramme mit dem gegebenen Type als 2. Komponente. Dieses Maß dient als Grundlage für den durchschnittlichen Informationsgehalt eines Types.
Datentyp:
- numerisch
- Gleitkommazahl (double precision)
- größer oder gleich, kleiner oder gleich
- -1.0
In folgenden Tabellen vorhanden:
In folgenden N-Gramm-Tabellen können Sie den Filter auf jede einzelne Komponente anwenden:Inhalt
Aktuelle Version
- 0.3
- Neue Tabellen: alle Maße auch schreibungsunabhängig verfügbar