|
|
|
[Contents] | [Index] |
Kooperation: U. Grimmer (Forschungszentrum Daimler Benz AG Ulm), S. Hizir (Humboldt-Universität zu Berlin, SFB 373)
Beschreibung der Forschungsarbeit: Hierarchische (agglomerative) Clusteranalysemethoden in Originalversion sind wegen der hohen Komplexität nicht zur Suche nach Auffälligkeiten und Subpopulationen in Massendaten geeignet. Auch modernste Computer können den mit der Beobachtungsanzahl in quadratischer Ordnung ansteigenden Rechenaufwand nicht bewältigen. In der Anwendungspraxis braucht trotzdem nicht auf einige dieser Methoden verzichtet zu werden. Beispielsweise kann unter geeigneten Annahmen (ohne detaillierte Kenntnis der Vorgeschichte des Fusionsprozesses) die hierarchische Clusteranalyse ab einem beliebigen Fusionsstand ausgeführt werden und dennoch unverfälschte Ergebnisse liefern.
Die in der praktischen Anwendung, z. B. beim Data Mining, relevanten Vorteile der hierarchischen Clusteranalyse sind insbesondere die Verarbeitung von gemischten Daten (quantitative, ordinale und qualitative Informationen) und die Zuordnung neuer Beobachtungen zu vorhandenen Klassen. So ist eine Zuordnung zu einem von K Clustern einer Hierarchie im Mittel weit weniger aufwendig als die mit linearem Aufwand durchzuführende Eingruppierung in K Cluster einer Partition.
Projektliteratur:
|
|
|
[Contents] | [Index] |