Braucht Nominalphrasenerkennung linguistisches Wissen?

Zusammenfassung Maschinelle Lernverfahren werden h‰ug zur eYzienten Annotation grofler Daten- mengen eingesetzt. Die Forschung zu maschinellen Lernverfahren beschr‰nkt sich i. a. darauf, unterschiedliche Lernverfahren zu vergleichen oder die optimale Grfle der Trainingsdaten zu bestimmen. Bisher wurde jedoch nicht untersucht, inwieweit sich linguistisches Wissen bei der Aufgabendenition positiv auswirken kann. Dies soll hier anhand des Lernens von Base-Nominalphrasen mit drei unterschiedlichen Denitionen untersucht werden. Die Denitionen unterschieden sich im Grad der linguistisch motivierten Erweiterungen, die zu einer eher praktisch motivierten er- sten Denition hinzukamen. Die Untersuchungen ergaben, dafl sich die Anzahl der falsch klassizier ten Wrter um ein Drittel reduzieren l‰flt. 21.1. Einleitung Maschinelle Lernverfahren werden h‰ug als Mittel angesehen, wenn sich die Aufgabe stellt, grofle Ressourcen auf dem Gebiet der syntaktischen Annotation mit vertretbarem Aufwand zu erstellen. In den letzten Jahren haben sich auf dem Gebiet des Maschinellen Lernens Verfahren zur Klassikation wie z. B. Entscheidungsb‰ume, Hidden-Markov-Modelle oder ‰hnlichkeitsba- siertes Lernen durchgesetzt; Implementierungen dieser Verfahren sind frei erh‰ltlich. Ein Vorteil von Klassikationsv erfahren wird oft darin gesehen, dafl fr die Aufbereitung der Korpora fr die Lernaufgabe kein linguistisches Wissen bentigt wird, dafl also linguistisches Wissen nur bei der Annotation des Trainingsmaterials, nicht jedoch bei der Anwendung von Lernverfahren eingesetzt werden mufl. Die Forschung im Bereich der maschinellen Lernverfahren beschr‰nkt sich i. a. auf den Vergleich verschiedener Lernverfahren oder auf Untersuchungen, welche Grfle bei Trainingskorpora bentigt wird bzw. welche Merkmale den Lernerfolg fr eine bestimmte Aufgabe und ein bestimmtes Lernverfahren maximieren. Es gibt jedoch keine Literatur darber, wie sich die Denition einer Lernaufgabe auf das Ergebnis auswirkt. In diesem Beitrag soll gezeigt werden, dafl fr die Denition der Lernaufgabe linguistisches Wissen von Vorteil sein kann. Die hier gew‰hlte Lernaufgabe besteht in der Erkennung von Nominalphrasen (NPs), eine Aufgabe, die auch schon zum Vergleich verschiedener Lernverfahren verwendet wurde (vgl. Sang und Buchholz, 2000). Als Lernverfahren wurde das NMemory-Based Erschienen in: Proceedings der GLDV-Frhjahrstagung 2001, Henning Lobin (Hrsg.), Universit‰t Gieflen, 28.n30. M‰rz 2001, Seite 225n233. http://www.uni-giessen.de/fb09/ascl/gldv2001/