Clusteranalyse erstellen < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
Hallo zusammen,
für ein Uniprojekt möchte ich eine Clusteranalyse einer Kundengruppe erstellen, um dann die Kunden nach verschiedenen Faktoren einteilen zu können.
Dazu habe ich mich bereits bei einem Unternehmen erkundigt, und wir haben verschiedene Faktoren (die Risikobereitschaft, erwarteter Ertrag, Liquidität und den Grad der Sophistizierung einer Investition) ausgemacht, die für eine solche Einteilung relevant sein können.
Diese können auch in konkrete Werte übertragen werden, so dass ein Fragebogen entsteht, auf dem zum Beispiel ein Kundenberater nur ein Kreuzchen auf einen Wert zwischen 1 und 5 setzen muss. (Risiko: 1-5, Ertrag: 1-5, Sophistizierung: 1-3, Liquidität 1-3)
Soweit so gut, ich bekomme die entsprechenden Daten auch, aber dann - was tun? Zuerst wird die Korrelation der einzelnen Variablen überprüft, wobei ich davon ausgehe, dass Risiko und Ertrag eine zu hohe Korrelation (0,7-0,8?) aufweisen.
Ist eine Clusteranalyse in der dritten Dimension möglich? Wenn ja, was ist das geeignetste Tool, bzw wie wird so etwas am geschicktesten angegangen?
Vielen Dank im Voraus
|
|
|
|
Hallo
Über die Nützlichkeit von Clusteranalysen in
Marktanalyse etc. kann ich nichts sagen.
Mathematisch (geometrisch) gesehen finde ich
aber z.B. den "k-means-Algorithmus" zur
Gruppierung einer Datenmenge von n Daten-
punkten in einem d-dimensionalen Raum
wirklich interessant. Da lässt sich für eine
Projektarbeit sicher etwas interessantes machen,
wenn die mathematischen Aspekte betrachtet
werden.
> Ist eine Clusteranalyse in der dritten Dimension möglich?
Aber sicher ! Im Prinzip kann der betrachtete
Datenraum beliebig viele Dimensionen haben.
Bei der praktischen Anwendung ist es aber wohl
doch nicht sinnvoll, irgendwelche zusammenge-
würfelten Kriterien (den Fragen eines Fragebogens
entsprechend) einfach einem Computer-Tool zu
übergeben, das dann ein Clustering herzaubert.
> Wenn ja, was ist das geeignetste Tool, bzw. wie wird so
> etwas am geschicktesten angegangen?
Da kenne ich mich nicht aus. Du müsstest dich wohl
zuerst in das Thema einlesen und dich wenn möglich
mit jemandem unterhalten, der auf dem Gebiet etwas
nützliches geleistet hat.
Das allerwichtigste Tool, das die übrigen einsetzt,
sollte der Kopf und eine gute Portion gesunder
Menschenverstand sein.
Links:
Zur ersten Information: Clusteranalyse
Veranschaulichung des k-means-Algorithmus: Applet
Gruß al-Chw.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:35 Di 02.12.2008 | Autor: | steffenhst |
Hallo,
Noch zu den Programmen: SPSS und SAS haben Clusteranalysen im Angebot. Spontan würde ich vermuten, dass es in R auch schon programmierte Routinen gibt.
Grüße, Steffen
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:23 Di 02.12.2008 | Autor: | luis52 |
> Spontan würde ich vermuten, dass es in R auch
> schon programmierte Routinen gibt.
vg Luis
|
|
|
|
|
hallo !
mit deiner Frage betr. Clusteranalyse hast du mich
dazu bewegt, selber ein kleines Programm zu schreiben,
das Datenpunkte in der Ebene hierarchisch zu Gruppen
zusammenfasst. Als Dank für diese Anregung hier ein
Output. 50 Datenpunkte werden nach ihren Distanzen
schrittweise zu Clustern zusammengefasst, solange
irgendwo eine gewisse Minimaldistanz zwischen den
einzelnen Clustern unterschritten wird. Dann stoppt
das Verfahren.
[Dateianhang nicht öffentlich]
Schönen Sonntag ! Al-Chwarizmi
Dateianhänge: Anhang Nr. 1 (Typ: png) [nicht öffentlich]
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:45 Sa 06.12.2008 | Autor: | OhjeMathe |
Jederzeit wieder :)
Vielen Dank für alle Antworten oben,
habe mir jetzt mal Zugang zu einem Rechner mit SPSS verschaffen können, verlangt allerdings Einarbeitung.
Schönes Restwochenende
|
|
|
|
|
Hallo,
ich bins nochmal. Kämpfe ein bisschen mit der Clusteranalyse, aber ich bekomme Resultate. Eine Frage hätte ich noch, und zwar weisen - wie erwartet - die Variablen Risiko und Ertrag eine hohe Korrelation auf.
Deswegen würde ich sie gerne zusammenfassen, wie ist das möglich? Beide Variablen sind als Werte von 1-5 angegeben, ich weiß nicht wie ich daraus etwas kombinieren kann...
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:20 Mi 24.12.2008 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|