Projekt
dlex ist ein von der DFG gefördertes kooperatives Projekt der Professuren für allgemeine Psychologie 1 und theoretische Computerlinguistik an der Universität Potsdam sowie dem Projekt Digitales Wörterbuch der deutschen Sprache (DWDS) an der Berlin-Brandenburgischen Akademie der Wissenschaften.
Ziel des Projektes ist die Erstellung einer lexikalischen Datenbank für den Einsatz in der psychologischen und linguistischen Forschung.
Als Datengrundlage verwenden wir das Kernkorpus des DWDS. Neben Frequenzdaten auf superlexikalischer (n-Gramme), sublexikalischer (Morphem- und Silbenabfolge) und lexikalischer Ebene sollen auch speziellere Variablen wie contextual diversity und orthographische Nachbarschaft erhoben werden; hierbei handelt es sich um Daten, die weit über das hinaus gehen, was im lexikographisch ausgerichteten Projekt DWDS erarbeitet wird.
Um die Relevanz der verschiedenen Variablen für die Sprachverarbeitung des Menschen zu validieren, sind Blickbewegungs- und Reaktionszeitexperimente Teil des Projektes.
Die Generierung linguistischer Daten wie beispielsweise der Morphem-, Phonem- und Silbenfrequenzen für die Wortformen eines solch umfangreichen Korpus lässt sich von Hand nicht bewältigen. Wir greifen daher auf Forschungsergebnisse der theoretischen Computerlinguistik an der Universität Potsdam zu Bereichen wie der effizienten morphologischen und syntaktischen Analyse zurück.
Die lexikalische Datenbank dlex soll als allgemeine Ressource für Studien im Bereich der experimentellen Psychologie, der Psycholinguistik und der Linguistik zur Verfügung stehen und CELEX für diesen Bereich ergänzen.
Gefördert durch die Deutsche Forschungsgemeinschaft (KL 955/12-1 und KL 955/19-1).
Aktuelle Version
- 0.3
- Neue Tabellen: alle Maße auch schreibungsunabhängig verfügbar