Fehlende Daten beim Data-Mining

ZusammenfassungDer Beitrag zeigt, in welchem Schritt der Analyse von großen Datenmengen die Behandlung von fehlenden Daten stattfindet und warum ein angemessener Umgang mit diesen unerlässlich ist. Vorgestellt werden zudem Methoden zum Umgang mit fehlenden Werten, die sich insbesondere im Kontext von Data-Mining eignen, da hier die Komplexität der Algorithmen eine übergeordnete Rolle spielt. Abgerundet wird der Beitrag mit einer Fallstudie, in der die Verfahren auf einen Beispieldatensatz des US Census Bureau angewandt werden, der in ähnlicher Weise oft in CRM-Systemen der betrieblichen Umwelt anzutreffen ist. Thematisiert werden die Auswirkungen der Methoden sowie in der Praxis zu erwartende Herausforderungen.