MIDAS – ein Multistrategiesystem zum explorativen Data Mining

Viele Anwendungen der Wissensentdeckung benotigen einen explorativen Data Mining-Ansatz, der menschliche Intuition und Sachkompetenz mit effizienten Techniken zur Strukturerkennung und Beschreibung kombiniert. Wir haben mit MIDAS ein System entwickelt, das zu diesem Zweck zwei Integrationsaspekte realisiert: (a) Die Verbindung zwischen der Erkennung von Strukturen durch ein neuronales Netz und ihrer Beschreibung durch ein maschinelles Lernverfahren, sowie (b) die Einbindung des Benutzers in die maschinelle Strukturerkennung und Beschreibung uber Visualisierungstechniken. In diesem Beitrag konzentrieren wir uns auf Strukturerkennung und stellen hierzu zwei Basis-Techniken der MIDAS-Datenvisualisierung vor. Erfahrungen mit drei Anwendungsfeldern illustrieren ihren Nutzen und ihre systemtechnische Umsetzung: Eine Analyse medizinischer Labordaten, eine Standortanalyse fur den Einzelhandel sowie eine Untersuchung von Strukturen in textuellen Dokumentensammlungen.

[1]  Matthias Jarke,et al.  Tools for data warehouse quality , 1998, Proceedings. Tenth International Conference on Scientific and Statistical Database Management (Cat. No.98TB100243).

[2]  Herman Chernoff,et al.  The Use of Faces to Represent Points in k- Dimensional Space Graphically , 1973 .

[3]  Stefan Wrobel,et al.  Extensibility in Data Mining Systems , 1996, KDD.

[4]  Hing-Yan Lee,et al.  Exploiting Visualization in Knowledge Discovery , 1995, KDD.

[5]  Thomas Villmann,et al.  Topologieerhaltung in selbstorganisierenden neuronalen Merkmalskarten , 1996 .

[6]  Gary Marchionini,et al.  A self-organizing semantic map for information retrieval , 1991, SIGIR '91.

[7]  Anil K. Jain,et al.  A non-linear projection method based on Kohonen's topology preserving maps , 1992, Proceedings., 11th IAPR International Conference on Pattern Recognition. Vol.II. Conference B: Pattern Recognition Methodology and Systems.

[8]  Yanda Li,et al.  Self-organizing map as a new method for clustering and data analysis , 1993, Proceedings of 1993 International Conference on Neural Networks (IJCNN-93-Nagoya, Japan).

[9]  Timo Honkela,et al.  Self-Organizing Maps of Document Collections: A New Approach to Interactive Exploration , 1996, KDD.

[10]  Samuel Kaski,et al.  Visualizing the Clusters on the Self-Organizing Map , 1994 .

[11]  Matthias Jarke,et al.  Document Maps: Semantic Structuring of Technical Document Collections , 1999 .

[12]  Hans-Peter Kriegel,et al.  Visualization Techniques for Mining Large Databases: A Comparison , 1996, IEEE Trans. Knowl. Data Eng..

[13]  Hsinchun Chen,et al.  Internet Categorization and Search: A Self-Organizing Approach , 1996, J. Vis. Commun. Image Represent..

[14]  Alfred Inselberg,et al.  Parallel coordinates for visualizing multi-dimensional geometry , 1987 .

[15]  O. Mangasarian,et al.  Multisurface method of pattern separation for medical diagnosis applied to breast cytology. , 1990, Proceedings of the National Academy of Sciences of the United States of America.

[16]  Hans-Jürgen Zimmermann,et al.  Automatische Akquisition von unscharfem Expertenwissen , 1991, Künstliche Intell..

[17]  Matthias Jarke,et al.  2 Designing Standards for Open Simulation Environments in the Chemical Industries: A Computer‐Supported Use‐Case Approach , 1999 .

[18]  Hing-Yan Lee,et al.  Visualization Support for Data Mining , 1996, IEEE Expert.

[19]  Alfred Inselberg,et al.  Parallel coordinates: a tool for visualizing multi-dimensional geometry , 1990, Proceedings of the First IEEE Conference on Visualization: Visualization `90.

[20]  Stefan Sklorz,et al.  Semantic Structuring and Visual Querying of Document Abstracts in Digital Libraries , 1998, ECDL.

[21]  Helge J. Ritter,et al.  Selbstorganisierende neuronale Karten , 1988 .

[22]  Jianping Zhang,et al.  Selecting Typical Instances in Instance-Based Learning , 1992, ML.