Daten- und Systemintegration im Precision Livestock Farming mit Serviceorientierten Architekturen und Semantischen Technologien

Innerhalb der Wertschopfungskette Ferkelerzeugung – Mast – Schlachthof existieren mehrere Informationsquellen und -senken die bislang technisch nur eingeschrankt vernetzt sind. Derzeit werden im InfrAgrar-Projekt Methoden und Ansatze entwickelt, die Verknupfung bestehender Systeme auf Basis von semantischen Technologien und serviceorientierten Architekturen zu vereinfachen. Kern hierbei ist der „virtuelle Bauernhof“, der in Komponenten an verschiedenen Stellen verteilt lauffahig ist und Kommunikation uber ontologiegesteuerte Schnittstellen realisiert. 1 Einleitung und Problemstellung Neben den klassischen Produktionsfaktoren Arbeit, Boden, Kapital und Rechten gewinnt Information in der Landwirtschaft zunehmend an Bedeutung als Faktor, der den unternehmerischen Erfolg eines Betriebes bestimmt. Daten werden zwar an einer Vielzahl von Stellen – z. B. durch Sensoren oder durch Anbieter im Internet – bereitgestellt, dennoch handelt es sich dabei um Informationsinseln, die bislang in nur geringem Mas sinnvoll zur Ableitung von Handlungsempfehlungen verknupft werden konnen. Im Rahmen des Projektes InfrAgrar werden derzeit Methoden und Technologien entwickelt, die am Beispiel der Domane Mastschweinehaltung die Verknupfung von im Stall erhobenen Daten mit weiteren Daten, die von auserhalb des Betriebes oder aus anderen Betriebszweigen stammen und derzeit in verschiedenen Standards, unstrukturierten Formaten oder Dokumenten geliefert werden, ermoglicht. Ziel dabei ist es, Daten anwendungsfallunabhangig zuganglich zu machen. Es wird also nicht lediglich ein einziges Anwendungsszenario betrachtet sondern versucht, grundlegende Spezifikationen zu schaffen, die es erlauben, an verschiedenen Stellen in vernetzten Systemen gespeicherte Daten in unterschiedlichem Kontexten und fur individuelle Fragestellungen zu nutzen. 2 Material und Methoden Eine Hauptkomponente der Entwicklungen ist eine Ontologie der Domane Mastschweinehaltung. Eine Ontologie ist nach Gruber eine explizite Spezifikation einer Konzeptualisierung eines Anwendungsbereichs [Gr92]. Wichtige Konzepte – wie beispielsweise Begriffe einer Domane, Objekte oder weitere Datenentitaten – und deren Relationen werden dabei identifiziert und in formaler Form, d. h. maschinenlesbar, festgehalten. Diese explizite Formulierung geht hierbei uber das Spezifizieren von Syntax oder Datenstrukturen – wie es z. B. aus der Erstellung formaler Sprachen (z. B. Programmiersprachen oder Markup Languages) oder der Modellierung von Datenbanken und Anwendungen (objektorientierte Modellierung, Entity-Relationsship-Diagramme) bekannt ist – hinaus und versucht durch graphenbasierte Technologien auch die Semantik, also die Bedeutung der Konzepte zuganglich zu machen. Betrachtet wird die Wertschopfungskette von der Ferkelerzeugung uber die Mast bis zum Schlachthof. Technologien, die hierbei eingesetzt werden sind sowohl der Resource Description Framework (RDF, [KC04]) des World Wide Web Consortium als auch Topic Maps, die als ISO-Norm 13250 von der International Standards Organization gepflegt werden [ISO03]. Dabei werden sogenannte RDF Schemas [BG04] entwickelt, die sich mit bestehenden RDFModellen fur die Landwirtschaft – insbesondere agroRDF [Ma10, MSK11] – integrieren lassen. Mittels Topic Maps wird versucht, spezielle Funktionalitaten zu realisieren, die sich in RDF nur uber zusatzliche Hilfskonstrukte oder weniger intuitiv implementieren lassen (z. B. Typisierung von Resourcen). Bei der Modellierung wird kein vordefinierter Anwendungsfall mit bekannten Akteuren und Datenflussen herangezogen, sondern alle relevanten Objekte sowie deren Eigenschaften und Beziehungen innerhalb der Domane berucksichtigt. Dies schliest beispielsweise Tiere (in verschiedenen Stufen der Entwicklung), Gebaude und Anlagen, Futter-, Arzneiund Betriebsmittel etc. mit ein. Um die Kernkonzepte und Relationen zu identifizieren, wird zuruckgegriffen auf eine Reihe von implizit in Dokumenten, IT-Standards und Anwendungen existierenden Modellen. Relevante Klimaparameter oder einige Stammdaten des Tieres werden beispielsweise aus dem Agricultural Data Element Dictionary des ISOagriNet-Standards [ISO07], der zunehmend Verbreitung in der Vernetzung von Anlagen im Stall findet, abgeleitet. Auserdem werden offentlich zugangliche Dokumente (mit teilweise gesetzlich geregeltem Informationsinhalt) der Registrierungsbehorden fur Tierarzneimittel und Futtermittel und Laborberichte zu Futtermittelanalysen o.a. sowie Schlachtberichte berucksichtigt. Auf Seite existierender Anwendungen in Versuchsstallen stehen Datenbankexporte zur Verfugung. Als experimentelle Infrastruktur wird der Versuchsstall der Universitat Hohenheim auf dem Unteren Lindenhof genutzt. Auserdem stehen Ergebnisse aus anderen Projekten zur Verfugung, die in die Modellierung einfliesen. Gegebene Modelle werden uber die ubergreifende Domanenontologie verknupft, wo notwendig werden entsprechende, formale Mappings erstellt. Im Anschluss werden Demonstratoren erstellt, die Kontextunabhangigkeit und Flexibilitat des ontologiebasierten Ansatzes aufzeigen (s. Abschnitt „4 Ausblick“). 3 Ergebnisse und Diskussion Aus Sicht der Datenmodellierung mussten sehr unterschiedliche Reprasentationen von Informationen in der Ontologie berucksichtigt werden. Einerseits mussen komplexe Dokumente wie Arzneimittelbeipackzettel und andere zusammenfassende Berichte sowie deren Inhalte in der Ontologie eingeordnet sein. Diese sollen in Diensteinfrastrukturen spater ad hoc mit semantischen Strukturen angereichert werden. Auf der anderen Seite des Spektrums stehen Messdaten von Sensoren in den unterschiedlichsten Auspragungen, die meist fest definiert und immer in denselben Strukturen ausgeliefert werden. Diese bilden z. B. die Grundlage fur Aussagen uber das Stallklima und Futterkonsum der Tiere. Die Beziehung zu den Tieren wird in der Regel uber den Standort abgeleitet, weil man derzeit noch nicht von einer Einzeltiererkennung bei Mastschweinen ausgehen darf. Eine luckenlose Dokumentation von Zuund Abgangen in einzelnen Stufen ist daher fur die Zuordnung unabdingbar. Ein Schwerpunkt ist der Umgang mit unterschiedlichen Methoden der Datenbereitstellung aus dem Bereich des Semantic Web. Um Wiederverwendbarkeit von allen Dienstleistungsanbietern ohne Einschrankung gewahrleisten zu konnen, mussten bestehende Formate und Datenstandards – die gegebenenfalls verlustfrei ineinander umgewandelt werden mussen – in das Konzept miteingebunden werden. Einige Losungen zu Detailfragen stehen zum jetzigen Zeitpunkt noch aus. So gibt es fur die Reprasentation physikalischer Grosen als Produkt von Wert und Einheit mehrere Moglichkeiten, die fur eine automatisierte Weiterverarbeitung jeweils eigene Vorund Nachteile aufweisen. Auch stost der Einsatz von Hilfskonstrukten wie z.B. "Blank Nodes" in RDF bei der Konvertierung und komplexeren Datenbankabfragen auf Grenzen.