Themengebiete der DeLFI-Tagungen und -Workshops und ihre Dynamik über die vergangenen Jahre

Der Artikel liefert einen Beitrag zur Community-Analyse der DeLFITagung, und zwar im Gegensatz zu etablierten personenbezogenen Verfahren aus thematischer Sicht. Damit schliest er an die inhaltliche Aufbereitung des Fachgebiets im Rahmen der ermittelten Forschungsherausforderungen des ELearning an. Mittels Text-Mining werden die Tagungsbande der DeLFI und ihrer Workshops auf inhaltliche Schwerpunkte und Veranderungen untersucht, die im Themenfeld interdisziplinar verortet werden. Aus der zeitlichen Abfolge der so generierten Themenlandkarten lassen sich zudem Schlussfolgerungen und Anregungen fur die Zukunft der DeLFI-Community ableiten. 1 Ziele und Verfahren der Community-Analyse Der internationale und interdisziplinare Austausch von Arbeitsergebnissen nimmt bestandig zu. Plattformen fur den wissenschaftlichen Austausch ‒ egal ob Konferenzen, Workshops oder Zeitschriften ‒ vervielfaltigen und diversifizieren sich in zunehmendem Mase. Wo noch vor einigen Jahrzehnten wenige renommierte Tagungen und Journals das Geschehen bestimmten, konkurrieren nun zahlreiche Plattformen um die Gunst der Autoren und (zahlenden) Teilnehmer bzw. Leser [Gru11]. Neben fachlichen Schwerpunkten treten attraktive Reiseziele sowie verschiedene Begutachtungsund Publikationsstrategien in den Vordergrund. Kundenbindung ist daher auch bei Wissenschaftlern von zunehmender Bedeutung. Der Anspruch ist, die Balance aus einem stabilen Kern von Autoren (Abgrenzung der eigenen Community von anderen) und einer gesunden Fluktuation weiterer Personen (Vernetzung der eigenen Community mit anderen) zu halten. Hier setzen verschiedene Mechanismen der Community-Analyse an. Beispielhaft seien die Arbeiten von Kienle & Wessner [KW07] zur CSCL-Konferenz sowie von Reinhardt [Re11] zur EC-TEL genannt. Der Fokus der Untersuchungen liegt hier auf personellen Verflechtungen, z. B. uber Ko-Autorenschaft und Zitationen, auch im institutionellen und geographischen Kontext. So lassen sich etwa Aussagen daruber ableiten, wie gros die Anteile wiederkehrender/wechselnder Autoren sind; ob es innerhalb der Community bestimmte Autoren-Cluster gibt; welchen Anteil unter den Autoren bestimmte Arten von Institutionen (Universitat, Fachhochschule, Industrie, ...) oder bestimmte Regionen ausmachen. Hinter all diesen Aspekten steckt die gemeinsame Grundfrage der gesunden Balance, d. h. sowohl die Dominanz einiger weniger Fachleute als auch ein jahrlich neues Zusammenwurfeln auszuschliesen. In der hier vorgestellten Arbeit wird ein anderer Ansatz verfolgt. Angelehnt an die in den letzten Jahren identifizierten und systematisierten Forschungsherausforderungen des E-Learning [Dr11][LS12] steht eine inhaltliche Betrachtung der DeLFI-Community im Vordergrund. Einfache Verfahren wie z. B. Tag Clouds (vgl. Abbildung 1) arbeiten allein mit der Haufigkeit eines Begriffes in einer Textsammlung. Abbildung 1: Inhaltsvisualisierung auf Basis von Worthaufigkeiten in einer Tag Cloud am Beispiel des Tagungsbands der DeLFI 2011 (generiert mit TagCrowd) Der Kontext der Nennung eines Begriffes bzw. sogar semantische Zusammenhange bleiben dabei jedoch unberucksichtigt. Der vorliegende Beitrag soll diese Lucke schliesen. Die Grundfrage ist dabei, inwiefern die DeLFI und ihre Workshops das Themenspektrum des E-Learning ‒ auch im Kontext verwandter Tagungen und Facher ‒ bedienen, welche Veranderungen sich uber die Jahre ergeben haben und wohin kunftige Entwicklungen gehen konnten. Dafur kommt eine korpuslinguistische Kohonenprojektion zum Einsatz, die in Abschnitt 2 zunachst kurz vorgestellt wird. Anschliesend werden die Analyse-Ergebnisse fur die DeLFI-Tagungen und -Workshops in Abschnitt 3 prasentiert. Der Beitrag schliest mit einer Zusammenfassung und einem Ausblick auf offene Fragen in Abschnitt 4. 2 Korpuslinguistische Kohonenprojektion Am Institut fur grafische Wissensorganisation ist mit der korpuslinguistischen Kohonenprojektion ein vielseitiger Text-Mining-Algorithmus entwickelt worden, der zur Visualisierung einer Textsammlung durch ein kunstliches neuronales Netz auf der TermDokument-Matrix der Textsammlung aufsetzt. In vorausgegangenen Versuchen konnte gezeigt werden, wie ohne Vorbedingungen, in vollkommener Selbstorganisation inharente semantische Strukturen aus einer zufallig zusammengestellten Textsammlung hervor traten. Zur Interpretation werden diese Strukturen einer erfahrungsbedingten Beurteilung unterzogen, die je nach Standort des Beurteilers verschieden ausfallen kann. Grundlage der Interpretation sind die grafischen Karten der korpuslinguistischen Kohonenprojektion, die aus einer Anordnung von haufigen, in den einzelnen Texten auffindbaren Termen und je zu einzelnen Dokumenten gehorigen Hohenprofilen zusammengesetzt sind. Das Verfahren basiert auf sog. Self-Organizing Maps [Koh90], die inzwischen in vielen Disziplinen zur systematischen Datenanalyse eingesetzt werden. Die Koordinaten der Terme werden uber ein neuronales Netz entsprechend der Nahe des Auftretens dieser Terme ausgegeben; die Hohenprofile unterhalb der Termanordnungen verbildlichen die Haufigkeit der Terme in den dazugehorigen Quellen [Mar11]. Die Termauswahl einer korpuslinguistischen Kohonenprojektion kann manuell oder per Algorithmus erfolgen. Eine schlichte Variante liefert das Produkt aus der Haufigkeit einer Zeichenkette und der Anzahl der Dokumente in denen sie gefunden wurde. In absteigender Sortierung werden aus den so ermittelten Begriffen die 200 hochwertigsten Substantive (einschlieslich gebeugter Formen und Synonyme) selektiert, um die fur das Training des neuronalen Netzes notwendigen Inputvektoren zu bilden. Aktuell wird am Institut fur grafische Wissensorganisation zur weiteren wissenschaftstheoretischen Verortung des Verfahrens, auf kritisch-rationalen Positionen aufbauend, ein methodisches Vorgehen im Erkenntnisprozess untersucht, von dem angenommen wird, dass es die Induktion im Sinne kritisch-rationaler Wissenschaftlichkeit in Teilen rehabilitieren kann. Im Speziellen wird versucht, die Distanz von phanomenologischem und empirischem Wissenschaftsverstandnis ein Stuck weit zu verringern. Den Text als beobachtbares Verhalten zu deuten, soll den Bedingungen empirischer Forschung Rechnung tragen; die gleichzeitige Annaherung an die phanomenologische Denktradition begrundet sich in der Annahme, dass Autoren in der Textform ihr unmittelbares Erleben zur Anschauung bringen. Das Verfahren der korpuslinguistischen Kohonenprojektion wurde seit Dezember 2010 an mehreren Textbestanden zu unterschiedlichen Fragestellungen erprobt. Im Juli 2011 wurde das Verfahren im Rahmen des Ideenwettbewerbs 2011 – „Die besten Ideen im Forschungsraum Rostock“ pramiert und von den Juroren in der Kategorie „Forschende“ auf den 1. Platz gewahlt. 3 DeLFI Themenlandkarten Um das Themengebiet des E-Learning aufzuspannen, wurden zwei umfassende Grundlagenwerke des Faches herangezogen: das Handbuch E-Learning [HW10] und das L3T-Buch [ES11] mit insgesamt ca. 4000 Seiten. Dieser Referenzkorpus behandelt 1 http://issuu.com/grawis.org neben den von der DeLFI adressierten Informatik-Themen auch mediendidaktische, organisatorische, juristische, wirtschaftliche u. a. Fragestellungen und erlaubt daher eine interdisziplinare Verortung im Gesamtzusammenhang. Im Ergebnis entsteht eine Grundstruktur der relevanten Themen und ihrer Bezuge zueinander, d. h. die Platzierung von Begriffen in einer Karte. In diese Struktur wurden nun die als PDF verfugbaren DeLFI-Materialien (d. h. die LNITagungsbande 2003 2011 und die Workshop-Bande 2005 2011) eingeordnet. Je nach Haufigkeit der Nennung eines Begriffs bzw. seiner Synonyme ergibt sich ein bestimmtes Hohenprofil von blau = kalt, also selten genannt, bis rot = heis, also haufig genannt. Die so aufgespannten Themenlandkarten zeigen Inseln i. S. isoliert betrachteter Themen, Gebirge i. S. komplexer Betrachtungen, aber auch Taler i. S. kaum behandelter Aspekte. Aus dem zeitlichen Verlauf lassen sich zudem Trends ableiten. Der Referenzkorpus erfullt in diesem Fall zweierlei Funktionen. Zum Einen offnet er den Blick auf den interdisziplinaren Kontext des Faches. Zum Anderen erlaubt er es aber auch erst, thematische Zusammenhange als Argumentationslinien abzubilden, die aufgrund der vglw. kurzen und zusammenhanglosen Texte eines Tagungsbandes sonst nicht in sinnvolle Relation zueinander zu bringen waren. Bei der nachfolgenden Auswertung wurden die manuell ausgewahlten Termini zu Grunde gelegt, die sich zu etwa einem Drittel von den automatisch ermittelten Favoriten unterscheiden. Insbesondere fehlen hier englische Begriffe und generell haufige Worter in Publikationen wie „Hrsg.“, „Abbildung“, „Tabelle“ usw. Die mittels automatischer Termauswahl erzeugten Visualisierungen stehen (jedoch ohne verbale Interpretation) im Web zur Verfugung.