DSSSL zur Verarbeitung linguistischer Korpora

Einleitung Die Document Style Semantics and Specification Language [ISO 10179:1996] – oder kurz DSSSL – ist seit 1996 ein Standard der Internationalen Standardisierungsorganisation (ISO). In ihm werden insgesamt vier verschiedene – jedoch miteinander verwobene oder kombinierbare – Sprachen definiert. Mit Hilfe dieser Sprache(n) ist es möglich, Texte, die nach den Vorgaben der Standard Generalized Markup Language (SGML, [ISO 8879:1986]) annotiert wurden, zu transformieren und/oder zu formatieren. DSSSL stellt im Gegensatz zu den meisten anderen texttechnologischen Standards 2 eine Programmiersprache dar. In den meisten Anwendungen werden die Programmiermöglichkeiten insbesondere für die Druckaufbereitung von Texten genutzt (z.B. zur Indexoder Inhaltsverzeichniserzeugung). Die Möglichkeiten von DSSSL gehen jedoch über dieses primäre Anwendungsgebiet hinaus. Computerlinguistische Verfahren, z.B. Parsingalgorithmen, lassen sich gut mit den in DSSSL verwendeten Programmiermöglichkeiten verbinden. Es soll nachfolgend skizziert werden, wie eine solche Integration bewerkstelligt werden kann.