Kontextbasiertes Retrieval unter Verwendung verknüpfter Annotationen

Kollaborative Arbeitsumgebungen im Web k önnen Mechanismen enthalten, mit denen neben dem Erstellen von zum Dokument geh örenden Metadaten auch ein wissenschaftlicher Diskurs̈ uber das eigentliche Dokument gef ührt werden kann (z.B. über freie Annotationen). Dieser Diskurs kann wertvolle Informationen über das Dokument enthalten, die aus den Metadaten nicht ersichtlich sind. Es wird gezeigt, wie sich ein solcher wissenschaftlicher Diskurs mittels Annotationen und Diskursstrukturrelationen modellieren l äßt und wie man die daraus gewonnenen Informationen beim Retrieval ausnutzen kann. 1 Einführung und Motivation Das COLLATE-Projekt 1 hat sich zum Ziel gesetzt, ein webbasiertes Kollaboratorium 2 zu entwickeln, mit dessen Hilfe Archivare, Wissenschaftler und Endbenutzer gemeinsam am und mit digitalisiertem kulturellen Material arbeiten k önnen. In diesem Projekt geht es um historisches Filmmaterial, konkret digitalisiertes Material über europ̈aische Filme des fr̈ uhen zwanzigsten Jahrhunderts (f ür detailliertere Informationen siehe auch [BTSDW01]). Beispielsweise kann es sich um Zensurdokumente handeln, denen sich der Zensurgrund und die im Film zensierten Stellen entnehmen lassen. Zu jedem digitalisierten Dokument werden in COLLATE Metadaten gesammelt, die z.B. die zensierende Beh örde, die zensierende Person, verschiedene Namen des dazugeh örigen Films, Art des Dokumentes (wie oben erẅ ahnt kann es ein Zensurdokument sein, aber auch ein Zeitungsartikel, Foto, etc) enthalten. Zus ätzlich zu diesen definierten Metadaten besteht in COLLATE noch die M̈oglichkeit, Dokumente zu annotieren bzw. auch bestehende Annotationen zu annotieren. Mit Hilfe dieser Annotationen k önnenwissenschaftliche Diskurse verwirklicht werden. Aus diesen Diskursen lassen sich u.U. wertvolle Informationen üb r den Gespr̈ achsgegenstand (das digitalisierte Dokument) entnehmen, die w ährend des Retrievalprozesses ausgenutzt werden k ö nen. Die Diskurse lassen sich also f ür Anfragen wie “gib mir alle Zensurdokumentë uber ein bestimmtes Zensurthema” ausnutzen, wie ein klei1Collaboratory for annotation, indexing and retrieval of digitized historical archive material IST-1999-20882, http://www.collate.de/ 2Ein Kollaboratorium(engl.: Collaboratory) ist ein aus den Begriffen CollaborationundLaboratoryzusammen gesetzter Begriff