BINGO! Ein thematisch fokussierender Crawler zur Generierung personalisierter Ontologien

Zusammenfassung Fokussierendes Crawling ist ein viel versprechender Ansatz zur Verbesserung der Ausbeute einer Expertensuche uber einem spezifischen Themenbereich des Webs. Dieses Verfahren beinhaltet die automatische Klassifikation von Dokumenten in eine benutzerspezifische Hierarchie von Themen, die wir auch als Ontologie bezeichnen. Die Qualitat der Trainingsdaten des Klassifikators ist der kritischste Punkt fur die Effektivitat eines fokussierenden Crawlers. Der BINGO!-Ansatz versucht die Grenzen einer Trainingsbasis mit nur wenigen intellektuell kategorisierten Dokumenten zu uberwinden und in einer automatisierten Wachstumsphase selbstandig eine breite Trainingsbasis durch die Identifikation themenspezifischer ”Archetypen” zu generieren. Die anschliesende Erntephase vervollstandigt dann die Ontologie nach iterativem Neutrainieren des Klassifikators mit einer verbesserten Ausbeute und Prazision.