Ein synkretismusmodell für die deutsche Morphologie

Morphologische Modelle in der Computerlinguistik reflektieren typischerweise sprachspezifische Eigenschaften, indem sie Datenstrukturen und Operationen verwenden, die der Typologie einzelner Sprachen entsprechen. Ausgehend von einer Diskussion der synkretistischen Eigenschaften der deutschen Flexionsmorphologie wird eine generische denotationelle Semantik fur die bekannten sprachubergreifenden morphologischen Strukturen entwickelt. Diese Semantik liegt dem Konzept eines Compilers fur ein generatives morphologisches Lexikon zugrunde, das 7000 Stamme aus einem Corpus spontan gesprochener deutscher Dialoge auf 30.000 Vollformen und 120.000 morphologische Kategorienabbildungen (nach Auflosung der Synkretismen) projiziert. Morphology models in computational linguistics have tended to be language-specific, in that the data structures and operations used have reflected the typology of individual languages. Starting with a discussion of the syncretistic properties of German inflectional morphology, a generic denotational semantics for known language-independent inflectional structures is outlined. This semantics underlies the design of a generative morphological lexicon compiler for spoken German, which projects 7000 stems extracted from a corpus of spoken language dialogues to 30,000 fully inflected forms and 120,000 morphological category mappings (after resolution of syncretism).