DSSSL zur Verarbeitung linguistischer Korpora
暂无分享,去创建一个
Einleitung Die Document Style Semantics and Specification Language [ISO 10179:1996] – oder kurz DSSSL – ist seit 1996 ein Standard der Internationalen Standardisierungsorganisation (ISO). In ihm werden insgesamt vier verschiedene – jedoch miteinander verwobene oder kombinierbare – Sprachen definiert. Mit Hilfe dieser Sprache(n) ist es möglich, Texte, die nach den Vorgaben der Standard Generalized Markup Language (SGML, [ISO 8879:1986]) annotiert wurden, zu transformieren und/oder zu formatieren. DSSSL stellt im Gegensatz zu den meisten anderen texttechnologischen Standards 2 eine Programmiersprache dar. In den meisten Anwendungen werden die Programmiermöglichkeiten insbesondere für die Druckaufbereitung von Texten genutzt (z.B. zur Indexoder Inhaltsverzeichniserzeugung). Die Möglichkeiten von DSSSL gehen jedoch über dieses primäre Anwendungsgebiet hinaus. Computerlinguistische Verfahren, z.B. Parsingalgorithmen, lassen sich gut mit den in DSSSL verwendeten Programmiermöglichkeiten verbinden. Es soll nachfolgend skizziert werden, wie eine solche Integration bewerkstelligt werden kann.
[1] M.McGee Wood,et al. Natural language processing in LISP , 1990 .
[2] C. M. Sperberg-McQueen,et al. Guidelines for electronic text encoding and interchange , 1994 .
[3] Herbert Stoyan. Programmiermethoden der künstlichen Intelligenz , 1988 .