HIP: Intelligente Suche nach Fachinformationen für das Handwerk

Angesichts des exponentiell wachsenden Informationsangebots im World Wide Web hat sich die Suche nach relevanten Ressourcen und Datenquellen mit der Zeit zu einem eigenstandigen Problem entwickelt. Allgemeine Web-Suchmaschinen verwenden fur die Erstellung der Rangliste der Treffer Autoritatswerte, die durch Linkanalyseverfahren auf reprasentativen Web-Ausschnitten bestimmt werden (ggf. kombiniert mit textbasierter Dokument-Query Ahnlichkeit). Diese Vorgehensweise scheitert jedoch oft bei sehr spezifischen fachlichen Anfragen mit insgesamt kleinem Recall. Daruber hinaus bleiben zahlreiche ’Hidden Web’ Informationsquellen (z.B. die Datenbanken der Informationsportale) fur konventionelle Crawler nicht zuganglich. Die Web-Suchmaschine des Projektes HIP (Handwerks-Informations-Portal), eines Kooperationsprojektes der Universitat des Saarlandes, der saarlandischen Handwerkskammer und der saarbrucker Hochschule fur Technik und Wirtschaft) kombiniert die Vorteile eines fokussierten Crawlers mit automatischer Erweiterung der Trainingsbasis, eines Frameworks fur automatisch erkannte, klassifizierte und als Web Services gekapselte ’Hidden Web’-Informationsquellen sowie einer Suchmaschine mit erweiterten Ranking-Moglichkeiten fur Web-Expertensuche. Dieses Papier beschreibt die Architektur des HIP-Frameworks, einzelne Komponenten des Suchsystems sowie die ersten Ergebnisse der Evaluation des Prototyps.