COLEX: Ein Computerlexikon für die automatische Sprachverarbeitung

In diesem Bericht wird das Computerlexikon COLEX beschrieben, das im Rahmen des Systems LINAS (Literaturrecherche in naturlicher Sprache) der FernUniversitat Hagen entwickelt wird. COLEX wird im Zusammenhang mit einer Wortklassenagenten-Analyse praktisch eingesetzt. Diese uberfuhrt naturlichsprachliche Satze bzw. Texte in eine Semantik-Reprasentationssprache, die am Paradigma der mehrschichtigen erweiterten semantischen Netze (MESNET) orientiert ist. Die Bedeutungsreprasentationen dienen dann als Ausgangspunkt der Fragetransformationen im System LINAS. Daruber hinaus bilden sie die Grundlage fur Inferenzen und Antwortgenerierung uber der zugrundeliegenden Wissensbasis in einem Frage-Antwort-System. Im Lexikon liegt ein besonderer Schwerpunkt auf der Reprasentation der Semantik sowohl der Lexeme selbst als auch der von ihnen vorstrukturierten Umgebung. Dabei greift COLEX auf die Darstellungsmittel der Wissensreprasentationssprache MESNET zuruck, die auch der Reprasentation von Weltwissen zugrunde liegt. MESNET umfasst ein Repertoire von 88 Relationen, 21 Funktionen und 43 Sorten, auf die sich die Beschreibung der lexikalischen Semantik stutzt. Durch die Verwendung eines einheitlichen begrifflichen und darstellungstechnischen Apparats fur Lexikon, Analyse, Wissensreprasentation und Inferenzmethoden wird eine Brucke zwischen linguistischem Wissen und Weltwissen geschlagen.