Tabelle Annotierte Types
Die Tabelle Annotierte Types enthält alle annotierten Types und ihre Eigenschaften. Sie wurde auf der Basis eines annotierten Korpus erstellt; d.h., die laufenden Wörter wurden unter Berücksichtigung des jeweiligen Kontextes morphosyntaktisch analysiert. Die Analyse umfasst
- die Zuweisung eines Part-of-Speech-Tags (Tagging)
- die Zuweisung eines Lemmas (Grund- oder Zitierform) (Lemmatisierung)
zu jedem laufenden Wort (Token).
Gleich lautende und mit demselben Ergebnis morphosyntaktisch analysierte Tokens werden als Instanzen eines annotierten Types aufgefasst (im Unterschied zum rein orthographisch definierten Typ, wo die morphosyntaktische Analyse keine Rolle spielt). Jedes annotierte Type, d.h. jede Zeile in der Annotierte Types-Tabelle ist definiert durch seine einmalige Kombination aus
- seiner orthographischen Form,
- seinem Part-of-Speech-Tag und
- seinem Lemma.
Beispiel: singen erscheint sowohl als Infinitiv (PoS-Tag VVINF) als auch als finites Verb (1. oder 3. Person Plural) (PoS-Tag VVFIN).
Die dritte konstituierende Komponente eines annotierten Types ist sein zugewiesenes Lemma. Das orthographische Type singen, aber auch die flektierten Formen singt, sangen usw. werden alle dem Lemma singen zugeordnet.
Zwei annotierte Types unterscheiden sich mindestens bezüglich einer dieser drei Komponenten.
Die Tabelle Annotierte Types bietet auch Zugriff auf annotierte Frequenzen. Sie enthält zum Beispiel separate Frequenzen für singen/VVINF als Infinitiv (16.5/Mill.) vs. singen/VVFIN als finites Verb (4.7/Mill.). Die Frequenz des rein orthographisch definierten Types singen, die in der Types-Tabelle abfragbar ist, entspricht der Summe der beiden annotierten Frequenzen: 21.2/Mill. Die Annotierte Types-Tabelle bietet also differenzierte Frequenzinformationen als die Types-Tabelle.
Die Annotierte Types-Tabelle enthält folgende Spalten zur Anzeige oder Filterung:
- Oberflächenfilter
- Frequenzfilter
Darüber hinaus bietet die Annotierte Types-Tabelle alle Filter aus den Tabellen Types und Lemmata an:
Inhalt
Aktuelle Version
- 0.3
- Neue Tabellen: alle Maße auch schreibungsunabhängig verfügbar