Aufwandsabschätzung für die Prozessierung vager Anfragen auf der Basis des Datenstrom-Ansatzes

Wir betrachten vage Anfragen, die als Kombination mehrerer vager Kriterien formuliert werden. Ein einzelnes Datenhank-Objektkann dabei ein vages Kriterium graduell erfullen. Hier beschranken wir uns auf solche Anfragen, bei denen die Berechnung der Antwort effizient auf die (evtl. wiederholte) Kombination von Rangordnungen zu neuen Rangordnungen zuruckgefuhrt werden kann. Da der Benutzer i.a. nur einige der besten Antwortobjekte inspizieren wird, mussen auch die jeweiligen Rangordnungen nur soweit berechnet werden, das ihm diese angeboten werden konnen. In diesem Beitrag zeigen wir Ansatze auf, wie abgeschatzt werden kann, wieviele Elemente von Rangordnungen zu einem einzelnen Kriterium benotigt werden, um eine festgelegte Anzahl von Ausgabeelementen zu erzeugen. Experimente an einer grosen Textdatenbasis belegen die Anwendbarkeit unseres Ansatzes.