[Next]:  Entscheidungstheorie für nichtparametrische Experimente  
 [Up]:  Projektbeschreibungen  
 [Previous]:  Numerische Methoden für nichtlineare parabolische partielle  
 [Contents]   [Index] 


Statistische Clusteranalyse

Bearbeiter: H.-J. Mucha  

Kooperation: U. Grimmer (Forschungszentrum Daimler Benz AG Ulm), S. Hizir (Humboldt-Universität zu Berlin, SFB 373)

Beschreibung der Forschungsarbeit: Hierarchische (agglomerative) Clusteranalysemethoden in Originalversion sind wegen der hohen Komplexität nicht zur Suche nach Auffälligkeiten und Subpopulationen in Massendaten geeignet. Auch modernste Computer können den mit der Beobachtungsanzahl in quadratischer Ordnung ansteigenden Rechenaufwand nicht bewältigen. In der Anwendungspraxis braucht trotzdem nicht auf einige dieser Methoden verzichtet zu werden. Beispielsweise kann unter geeigneten Annahmen (ohne detaillierte Kenntnis der Vorgeschichte des Fusionsprozesses) die hierarchische Clusteranalyse   ab einem beliebigen Fusionsstand ausgeführt werden und dennoch unverfälschte Ergebnisse liefern.

Die in der praktischen Anwendung, z. B. beim Data Mining,   relevanten Vorteile der hierarchischen Clusteranalyse sind insbesondere die Verarbeitung von gemischten Daten (quantitative, ordinale und qualitative Informationen) und die Zuordnung neuer Beobachtungen zu vorhandenen Klassen. So ist eine Zuordnung zu einem von K Clustern einer Hierarchie im Mittel weit weniger aufwendig als die mit linearem Aufwand durchzuführende Eingruppierung in K Cluster einer Partition.

Projektliteratur:

  1. H.-J. MUCHA, Clusteranalyse mit Mikrocomputern, Akademie Verlag, Berlin, 1992.
  2. \dito 
, ClusCorr: Cluster analysis and multivariate graphics under MS EXCEL, in: Classification and multivariate graphics: Models, software and applications, WIAS-Report No. 10 (H.-J. Mucha, H. H. Bock, Hrsg.), Berlin, 1996, pp. 97-105.
  3. U. GRIMMER, H.-J. MUCHA, Datensegmentierung mittels Clusteranalyse, in: Data Mining. Theoretische Aspekte und Anwendungen, (G. Nakhaeizadeh, Hrsg.), Physica-Verlag, Heidelberg, 1998, pp. 109-141.


 
Abb. 1: Distanzmatrix mit Dendrogramm in der hierarchischen Clusteranalyse

\ProjektEPSbildNocap {0.7\textwidth}{mucha.eps}



 [Next]:  Entscheidungstheorie für nichtparametrische Experimente  
 [Up]:  Projektbeschreibungen  
 [Previous]:  Numerische Methoden für nichtlineare parabolische partielle  
 [Contents]   [Index] 

LaTeX typesetting by I. Bremer
7/30/1999