Hauptkomponentenanalyse im 2D < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 12:18 Mi 16.08.2006 | Autor: | Kyaha |
Aufgabe | Gegeben sind 5 Punkte im 2D-Raum.
[mm]\vec{p}_1 = \begin{pmatrix} 4 \\ 5 \end{pmatrix}, \vec{p}_2 = \begin{pmatrix} 5 \\ 5 \end{pmatrix}, \vec{p}_3 = \begin{pmatrix} 4 \\ 7 \end{pmatrix},\vec{p}_4 = \begin{pmatrix} 6 \\ 5 \end{pmatrix}, \vec{p}_5 = \begin{pmatrix} 3 \\ 5 \end{pmatrix}[/mm].
Berechne die Haupt- und Nebenachse einer Ellipse, die alle Punkte einschliesst. |
Hier stehe ich momentan sehr auf dem Schlauch.
Zur Lösung der Aufgabe müßte (meiner Meinung nach) eine Hauptkomponentenanalyse durchgeführt werden.
Den Mittelpunkt der Ellipse berechne ich aus dem Schwerpunkt der Punktverteilung, also per [mm]\vec{m}^{neu} = \frac{1}{5} \summe_{k=1}^{5} \vec{p}_i = \begin{pmatrix} 4,4 \\ 5,4 \end{pmatrix} [/mm].
Dann müßten alle Punkte in das neue Koordinatensystem mit dem Ursprung [mm]\vec{m}^{neu}[/mm] verschoben werden -> [mm] \vec{p}^{neu}_i = \vec{p}_i - \vec{m}^{neu}[/mm].
Als nächstes müßte ich die Kovarianzmatrix aufstellen.
Hier habe ich einige Probleme.
Die Kovarianz müßte einfach zu berechnen sein, indem die jeweilige Koordinate von dem Mittelpunkt abgezogen wird und das Ergebnis nun miteinander multipliziert wird. Beispiel für [mm]\vec{p}_1[/mm]:
[mm] cov = (4 - 4,4) * (5 - 5,4) = -0,4 * -0,4 = 0.16 [/mm]
Sollte soweit alles richtig sein, hilft es mir momentan leider nicht weiter.
Wie stelle ich jetzt aus den einzelnen Kovarianten die Kovarianzmatrix auf? Würde es nicht eine 5x2 Matrix werden? Ich war bisher der Meinung, das die Kovarianzmatrix in diesem Fall eine 2x2 Matrix sein müßte - denn in so einem Fall wäre mir die Berechnung der Eigenwerte + Eigenvektoren recht klar.
Sofern ich mich richtig entsinne, müßten die Länge der beiden Eigenvektoren der Kovarianzmatrix die Länge der beiden gesuchten Achsen darstellen.
Ich hoffe, ich war nicht zu konfus und habe das richtige Forum gewähl. ;)
Besten Dank für die HIlfe im voraus!
Grüße
Kyaha
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 13:41 Mi 16.08.2006 | Autor: | riwe |
als amateur habe ich mir eine skizze gemacht, dann reduziert sich das problem auf ein ganz einfaches
[mm] \frac{(x-4.5)^{2}}{2.25}+\frac{(y-5)^{2}}{4.5}=1
[/mm]
[Dateianhang nicht öffentlich]
Dateianhänge: Anhang Nr. 1 (Typ: png) [nicht öffentlich]
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 14:27 Mi 16.08.2006 | Autor: | Kyaha |
Hallo!
Zeichnerisch hatte ich dies bisher nicht versucht zu lösen. Besten Dank für diese Idee. :)
Trotzdem würde mich der "mathematischere" Weg über Hauptkomoponentenanalyse (oder vielleicht noch etwas anders bei diesem "einfachen" 2D-Fall?!?) interessieren.
Hat hier vielleicht noch jemand einen Vorschlag?
Grüße
Kyaha
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 16:01 Mi 16.08.2006 | Autor: | riwe |
das mit zeichnen war ja nur als hilfe zu verstehen.
der weg war dann so: alle punkte außer P3 liegen auf einer zur x-achse parallelen geraden,
daher folgt 2a = maximaler abstand = d(P4;P5) => a = 1,5 und der mittelpunkt der ellipse heißt M(4,5/5).
damit kannst du die ellipsengleichung aufstellen
[mm] \frac{(x-4.5)^{2}}{2,25}+\frac{(y-5)^{2}}{b^{2}}=1
[/mm]
und durch einsetzen von P3 bestimmst du nun b.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:21 Mi 16.08.2006 | Autor: | ardik |
Hallo Kyaha,
auch von mir hier leider nur "dilettantische" Überlegungen.
Spitzfindig betrachtet eigentlich eine merkwürdige Fragestellung. Jedes Orthogonale Geradenpaar kann verwendet werden, die Ellipse muss dann nur groß genug sein...
Aber so ist das ja sicher nicht gemeint...
Ich hätte vielleicht die Abstände der Punkte zu "Deinem" Mittelpunkt bestimmt und daraus meine Schlussfolgerungen zu ziehen versucht. Aber damit bin ich ja auch erst beim (Mindest-)Radius eines Kreises, der diese Punkte einschließt...
Nur so Gedanken...
Schöne Grüße,
ardik
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 19:23 Do 17.08.2006 | Autor: | Kyaha |
Die Kovarianzmatrix (hier 2D) soll ja so erstellt werden:
[mm] \pmat{ {cov(xx) & {cov(xy)} \\ {cov(yx)} & {coy(yy)} } [/mm]
Ich verstehe jetzt allerdings nicht wirklich, wie ich von den 5 Punkten auf eine einzige 2x2 Matrix kommen kann.
Ich würde z.B. bei [mm]\vec{p}_1[/mm] die Elemente der Kovarianzmatrix so berechnen:
[mm]
cov(xx) = (4 - 4,4) * (4 - 4,4) = 0,16
cov(xy) = (4 - 4,4) * (5 - 5,4) = 0,16
cov(yx) = (5 - 5,4) * (4 - 4,4) = 0,16
cov(yy) = (5 - 5,4) * (5 - 5,4) = 0,16[/mm]
Aber ich kann mir nicht wirklich vorstellen, daß ich 5 Kovarianzmatrizen aufstellen muß um dann eine einzige nach den Hauptachsen zu analysieren.
Was ist an meinem Gedankengang falsch?
Grüße
Kyaha
|
|
|
|
|
Hallo Kyaha,
> Die Kovarianzmatrix (hier 2D) soll ja so erstellt werden:
> [mm]\pmat{ {cov(xx) & {cov(xy)} \\ {cov(yx)} & {coy(yy)} }[/mm]
>
> Ich verstehe jetzt allerdings nicht wirklich, wie ich von
> den 5 Punkten auf eine einzige 2x2 Matrix kommen kann.
>
> Ich würde z.B. bei [mm]\vec{p}_1[/mm] die Elemente der
> Kovarianzmatrix so berechnen:
> [mm]
cov(xx) = (4 - 4,4) * (4 - 4,4) = 0,16
cov(xy) = (4 - 4,4) * (5 - 5,4) = 0,16
cov(yx) = (5 - 5,4) * (4 - 4,4) = 0,16
cov(yy) = (5 - 5,4) * (5 - 5,4) = 0,16[/mm]
>
Du machst einen Denkfehler. Die Kovarianz ist ja nicht für einzelne Beobachtungen einer Stichprobe definiert sondern zwischen den Zufallsvariablen! und davon hast du in deiner stichprobe nur zwei, nämlich in der x- und der y-Komponente.
Die Kovarianz ist dann ein Maß für die Korrelation zwischen den Variablen.
In deinem Beispiel ist zB.
[mm] $Cov_{xy}=\frac15 \summe_{i=1}^5 (x_i [/mm] - [mm] \bar x)\cdot (y_i [/mm] - [mm] \bar [/mm] y)$
Es gehen also alle Beobachtungen in diese Rechnung ein. Außerdem musst du noch [mm] $Cov_{xx}$ [/mm] und [mm] $Cov_{yy}$ [/mm] berechnen, die ja eigentlich keine Kovarianzen sondern Varianzen sind. Dann hast du die vier einträge deiner matrix [mm] ($Cov_{yx}=Cov_{xy}$).
[/mm]
Gruß
Matthias
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 12:03 Fr 18.08.2006 | Autor: | Kyaha |
Danke!
Ich habe den Wald vor lauter xen nicht mehr gesehen.
Ein doofer Denkfehler.
Bevor ich noch mehr dieser Art mache, würde ich gerne eine kurze Bestätigung meines weiteren Vorgehens haben - wenn ich denn damit keine zu großen Mühen mache. :)
1) Ich berechne den Schwerpunkt (s.o.).
2) Ich berechne die Kovarianz [mm] Cov_{xy}=\frac{1}{5} \summe_{i=1}^5 (x_i - \bar x)\cdot (y_i - \bar y) = Cov_{yx} [/mm] (da symmetrisch)
3) Ich berechne die Varianzen
[mm] Cov_{xx} = \frac{1}{5} \summe_{i=1}^5 (x_i - \bar x)^2[/mm]
[mm] Cov_{yy} = \frac{1}{5} \summe_{i=1}^5 (y_i - \bar y)^2[/mm]
4) Aufstellen der Kovarianzmatrix als
[mm] M = \pmat{ Cov_{xx} & Cov_{xy} \\ Cov_{yx} & Cov_{yy} } [/mm]
5) Berechnen der Eigenwerte & Eigenvektoren der Kovarianzmatrix
Ergebnis: Die Länge der beiden Achsen entspricht den Eigenwerten der Kovarianzmatrix, die Richtung wird durch die Eigenvektoren der Kovarianzmatrix angeben.
Korrekt soweit?
Eine Frage habe ich noch - ich habe in einer Formelsammlung eben entdeckt, daß die die Varianz nicht mit [mm]\frac{1}{n}[/mm] normiert wird, sondern mit [mm]\frac{1}{n-1}[/mm].
Wer liegt da nun richtig?
Grüße
Kyaha
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:20 Fr 25.08.2006 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|