Semantische Integration durch Reinterpretation: ein formales Modell

In dieser Arbeit wird ein formales Modell fur die semantische Integration von heterogenen Wissensquellen entwickelt, das auf dem Prinzip der Reinterpretation basiert. Wahrend der Integration entstehende Konflikte werden durch eine konservative Neuinterpretation der im Konflikt enthaltenen Symbole aufgelost; Hypothesen uber semantische Beziehungen zwischen der alten und der neuen Lesart der Konfliktsymbole sind im Integrationsresultat enthalten. Das formale Modell fokussiert auf ein einfaches Integrationsszenario, in dem zwei Ontologien (Empfanger- und Senderontologie), die sich in der Praxis bewahrt haben und verwandte Terminologien besitzen, integriert werden. Mogliche Konflikte zwischen den Ontologien sollen durch die Ambiguitat in der offentlichen Sprache erklarbar sein; dieser Konflikttyp entsteht durch unterschiedliche Lesarten fur dasselbe Symbol in den unterschiedlichen Ontologien. Den Grundideen der Belief-Revision folgend lassen sich fur das zu Grunde gelegte Integrationsszenario Adaquatheitskriterien angeben, die axiomatisch durch Postulate formalisiert werden konnen. Es wird gezeigt, dass es in Form von Reinterpretationsoperatoren konkrete Integrationsverfahren gibt, die (Unterklassen von) den Adaquatheitskriterien genugen. Fur Reinterpretationsoperatoren erfolgt eine andere Konfliktdiagnose als fur Belief-Revisionsfunktionen; dennoch konnen Reinterpretationsoperatoren als Belief-Revisionsfunktionen dargestellt werden, sofern nicht die zu integrierenden Ontologien als Gegenstand einer Veranderung angesehen werden, sondern die in der Reinterpretation gebildeten Hypothesen uber die semantischen Beziehungen der verschiedenen Lesarten von ambigen Symbolen. Aus zwei inkompatiblen Postulatsklassen zum intendierten Integrationsszenario resultieren zwei Klassen von Reinterpretationsoperatoren, Typ-1- und Typ-2-Operatoren. Typ-1-Operatoren halten an der Terminologie der Empfangeron- tologie fest, Typ-2-Operatoren fuhren zu einer Adaption an die Terminologie der Senderontologie. Durch die Wahl von verschieden starken Hypothesen uber die semantischen Beziehungen der disambiguierten Symbole in den Ontologien konnen fur beide Typen verschieden starke Reinterpretationsoperatoren definiert werden; indem Aspekte zur Konservativitat und minimalen Anderung betrachtet werden, konnen deren Unterschiede durch Postulate beschrieben werden. Die wiederholte Anwendung von Reinterpretationsoperatoren kann fur eine sequenzielle Integration von Ontologien genutzt werden. Die sequenzielle und die einschrittige Integration einer Ontologie mittels Reinterpretationsoperatoren erweisen sich als zwei verschiedene nicht aufeinander reduzierbare Ansatze. Eine eingehendere Analyse der sequenziellen Integration mittels Stabilitat fordert weitere Unterschiede zwischen starken und schwachen Operatoren (des Typs 2) hervor; schwache Operatoren sind stabil, konnen dafur zu einer vergesslichen Adaption an die Terminologie der Senderontologie fuhren, infolge der Bezuge zu ursprunglichen Konzepten der Empfangerontologie verloren gehen. Starke Operatoren fuhren zu einer weniger radikalen Adaption, sind dafur aber instabil. This work presents a formal model for integrating heterogeneous knowledge sources which relies on the principle of reinterpretation. Conflicts occurring in the integration are resolved with a conservative strategy in which symbols involved in a conflict get a new interpretation; the result contains hypothesis on the semantical relatedness of the different readings of the conflict symbols. The formal model focusses on a simple integration scenario according to which two well proven ontologies (receiver’s and sender’s ontology) with similar terminologies have to be integrated. Conflicts can be explained by ambiguities in the public (common) language. This kind of conflict is caused by different readings of the same common symbol in different ontologies. Following the main ideas of belief revision, one can formalize adequacy criteria for the intended integration scenario by postulates. It can be shown that (subclas- ses of) the adequacy criteria are operationalizable by reinterpretation operators. Reinterpretation operators are based on a conflict diagnosis that is different from the conflict diagnosis for belief-revision functions. But reinterpretation ope- rators can be represented as belief-revision functions if one considers not the ontologies to be the object of revision but the set of hypothesis on the semantical relatedness of different readings of ambiguous symbols. Two incompatible subsets of the integration postulates are operationalized by two reinterpretation operators, type-1 and type-2 operators. Type-1 operators preserve the terminology of the receiver’s ontology, type-2 operators adapt to the terminology of the sender’s ontology. By choosing different sets of initial hypothesis on the semantical relatedness of ambiguous symbols operators of different strength can be defined. Differences between operators of different strength can be characterized by postulates that describe aspects of conservativity and minimality. Iterated applications of reinterpretation operators can be used for a sequentialized integration of ontologies. One-step integration and sequential integration by reinterpretation operators are not reducible to each other. Considering the stability of iterated reinterpretation operators results in additional differences in the set of reinterpretation operators (of type 2) with different strength. Weak operators are stable but may result in an amnesic adaption to the terminology — thereby loosing connections to concepts of the receiver’s ontology. Strong operators realize a less radical adaption but are instable.