next up previous contents
Next: Adaptive Clusteranalyse Up: Previous: ClusCorr - Statistiksoftware

Kredit Scoring

Bearbeiter: H.-J. Mucha, R. Siegmund-Schultze

Kooperation: K. Dübon, Forschungszentrum Daimler-Benz, Ulm

Beschreibung der Forschungsarbeit:

Kreditgeber (Banken, Kaufhäuser, etc.) sind bei der Vergabe von Krediten daran interessiert, daß sowohl die Rückzahlung der Kreditsumme als auch die Begleichung von Bearbeitungsgebühren und entstehenden Zinsen ordnungsgemäß abgewickelt wird. Für die Kredit(karten)geber ist es daher wichtig, die zukünftige Bonität eines potentiellen Kreditnehmers abzuschätzen. Die computerorientierte Statistik wird stark gefordert: Es sind sehr umfangreiche Datenmengen, bestehend aus numerischen und alphanumerischen Informationen, zeitlich effektiv in kompaktes und statistisch optimales ,,Bonitätswissen'' zu überführen. Das Bonitätswissen muß zudem ,,vor Ort'' von mathematischen Laien leicht handhabbar und intuitiv verständlich sein und vom zuständigen Management des Kreditgebers mitgetragen und akzeptiert werden. Spezielle adaptive Distanzmaße erweisen sich als optimal im Sinne der Trennbarkeit ,,guter'' und ,,schlechter'' Kreditnehmer. Sie werden auch benutzt, um hochdimensionale alphanumerische und numerische Daten graphisch darzustellen. Im Vergleich mit anderen statistischen Verfahren (Fahrmeir und Hamerle (1984)) können wir auf die geringsten Fehlerraten verweisen. Die zugehörige Software XCredit läuft unter Microsoft EXCEL. Abb.1 zeigt Fehlerkurven für Trainings- und Testdaten (16795 bzw. 14745 Kunden von Mobiltelefonkarten). Jeder Kunde wird durch Informationen beschrieben, die in einer Datensatzzeile stehen:

k1,kB,kFF,k2,k1,k1,k2,k0,k0,k0,kD,k1,k2,k4,k8,k7,k1
k0,kS,kME,k0,k1,k1,k3,k0,k0,k0,kD,k0,k4,k1,k0,k7,k0
...
Uns ist nur die letzte Angabe je Zeile vom Inhalt her bekannt: die Klassenzuordnung. Die Fehlerraten für die Testdaten betragen 4.62 % (C4.5-Algorithmus nach Quinlan), 5.03 % (logistische Regression), 5.67 % (lineare Diskriminanzanalyse) und 4.47 % (XCredit).

 

Projektliteratur:

  1. L. FAHRMEIR, A. HAMERLE, Multivariate statistische Verfahren, DeGruyter, Berlin, 1984.
  2. H.-J. MUCHA, R. SIEGMUND-SCHULTZE AND K. DÜBON, Adaptive cluster analysis techniques - software and applications, erscheint in: Classification and Data Analysis, Yajima, K. and Tanaka, Y. (Eds.), Springer-Verlag, Heidelberg.


Group_of_Office
Mon May 13 20:25:53 MET DST 1996