Faktorenanalyse < stoch. Analysis < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 13:45 Do 04.02.2010 | Autor: | Marcel08 |
Aufgabe | Im Folgenden ist die Faktorladungsmatrix einer Faktorenanalyse auf Basis der empirischen Korrelationsmatrix gegeben:
Factor1 Factor2
a 0.87 0.10
b 0.75 0.20
c - 0.40 0.30
d 0.72 0.68
e 0.87 - 0.21
a) Wie viele Variablen müssten mindestens vorliegen, damit 6 Faktoren extrahiert werden können?
b) Wie hoch ist der Erwartungswert des ersten Faktors? |
Hallo Matheraum!
Hinsichtlich der oben gestellten Aufgabe, habe ich den folgenden Lösungsvorschlag:
zu a)
Hier würde ich mit der folgenden Formal arbeiten:
[mm] (p-k)^{2}\ge(p+k) [/mm]
Mit k=6 ergibt sich dann durch die pg-Formel [mm] p_{1}=10 [/mm] und [mm] p_{2}=3
[/mm]
Für welchen der beide Werte müsste man sich hier entscheiden? Der Begriff "mindestens" lässt auf [mm] p_{2}=3 [/mm] zurückschliessen, oder?
zu b)
Hier würde ich den Erwartungswert zu
[mm] \bruch{1}{5}*\summe_{i=a}^{e}Factor1_{i}=0.562 [/mm]
errechnen.
Über eine Korrekturlesung würde ich mich freuen.
Gruß, Marcel
|
|
|
|
Hallo,
> Im Folgenden ist die Faktorladungsmatrix einer
> Faktorenanalyse auf Basis der empirischen
> Korrelationsmatrix gegeben:
>
>
> Factor1 Factor2
> a 0.87 0.10
> b 0.75 0.20
> c - 0.40 0.30
> d 0.72 0.68
> e 0.87 - 0.21
>
>
> a) Wie viele Variablen müssten mindestens vorliegen, damit
> 6 Faktoren extrahiert werden können?
> b) Wie hoch ist der Erwartungswert des ersten Faktors?
>
> c) Wie hoch sind die Kommunalitäten der Variablen a und
> b?
>
> d) Wie hoch sind die spezifischen Varianzen der Variablen d
> und e?
>
> e) Welche der folgenden Aussagen ist/sind richtig?
>
> A) Das Ziel einer Hauptkomponentenanalyse ist es, die Daten
> in einem
> niedriger dimensionalen Raum darzustellen.
>
> B) Eine Hauptkomponentenanalyse auf Basis der zentrierten
> Merkmale
> liefert exakt das gleiche Ergebnis wie eine
> Hauptkomponentenanalyse
> auf Basis der standartisierten Merkmale.
>
> C) Wenn eine Hauptkomponentenanalyse auf Basis der
> standartisierten
> Merkmale durchgeführt wird, dann ist nach dem
> Kaiser-Kriterium die
> Anzahl der Hauptkomponenten gleich der Anzahl der
> Eigenwerte, die
> größer als 1 sind.
>
> D) Wenn die Hauptkomponentenanalyse auf der empirischen
> Korrelationsmatrix beruht, können Eigenwerte auch negativ
> sein.
> Hallo Matheraum!
>
>
> Hinsichtlich der oben gestellten Aufgabe, habe ich den
> folgenden Lösungsvorschlag:
>
>
>
> zu a)
>
> Hier würde ich mit der folgenden Formal arbeiten:
>
>
> [mm](p-k)^{2}\ge(p+k)[/mm]
Warum? Woher kommt diese Formel? Was ist p und was ist k? Du brauchst da gar nichts rechnen, da man max. so viele Faktoren extrahieren kann, wie es Variablen gibt (dieser Extremfall entsteht dann, wenn alle Variablen untereinander unkorreliert sind). Die Antwort ist also 6.
>
> Mit k=6 ergibt sich dann durch die pg-Formel [mm]p_{1}=10[/mm] und
> [mm]p_{2}=3[/mm]
>
>
> Für welchen der beide Werte müsste man sich hier
> entscheiden? Der Begriff "mindestens" lässt auf [mm]p_{2}=3[/mm]
> zurückschliessen, oder?
>
>
>
> zu b)
>
> Hier würde ich den Erwartungswert zu
>
>
> [mm]\bruch{1}{5}*\summe_{i=a}^{e}Factor1_{i}=0.562[/mm]
>
>
> errechnen.
>
Wenn mit Erwartungswert Eigenwert gemeint ist (das sind zwei sehr sehr unterschiedliche Begriffe), dann musst du nur die Ladungen der Variablen auf den Faktor quadrieren und aufsummieren.
>
> zu c)
>
> [mm]Kommunalitaet_{a}=0.87^{2}+0.10^{2}=0.7669[/mm]
>
>
> [mm]Kommunalitaet_{b}=0.75^{2}+0.20^{2}=0.6025[/mm]
>
ja!
>
> zu d)
>
> [mm]Uniqueness_{d}=1-(0.72^{2}+0.68^{2})=0.0192[/mm]
>
>
> [mm]Uniqueness_{e}=1-(0.87^{2}+(-0.21)^{2})=0.199[/mm]
ja! Es ist also die durch die 2 Faktoren nicht erlärte Varianz.
> zu e)
>
> Hier habe ich mich für die Antwortmöglichkeiten A,C und D
> entschieden, auch wenn ich mir nicht wirklich sicher bin.
> Vielleicht hat hier jemand noch einen
> Verbesserungsvorschlag.
zu A: das ist richtig
zu B: das ist falsch, weil man eigentlich die Kovarianzmatrix in der Hauptkomponentenanalyse analysiert (diese ist bei z-Standardisierung mit der Korr-Matrix identisch). Zentriert man nur, dann sind die Variablen nicht auf einer Metrik und man bekommt andere EIgenwerte heraus. Ich glaube das zumindest.
zu C: das ist richtig
zu D: das kann nicht richtig sein, da Eigenwerte die Summe der quadrierten Ladungen auf den Faktor sind, also die Summe von stets positiven Werten.
Ich hoffe, dass das dir hilft.
Grüße, Steffen
|
|
|
|
|
> Hallo,
>
> > Im Folgenden ist die Faktorladungsmatrix einer
> > Faktorenanalyse auf Basis der empirischen
> > Korrelationsmatrix gegeben:
> >
> >
> > Factor1 Factor2
> > a 0.87 0.10
> > b 0.75 0.20
> > c - 0.40 0.30
> > d 0.72 0.68
> > e 0.87 - 0.21
> >
> >
> > a) Wie viele Variablen müssten mindestens vorliegen, damit
> > 6 Faktoren extrahiert werden können?
> > b) Wie hoch ist der Erwartungswert des ersten Faktors?
> >
> > c) Wie hoch sind die Kommunalitäten der Variablen a und
> > b?
> >
> > d) Wie hoch sind die spezifischen Varianzen der Variablen d
> > und e?
> >
> > e) Welche der folgenden Aussagen ist/sind richtig?
> >
> > A) Das Ziel einer Hauptkomponentenanalyse ist es, die Daten
> > in einem
> > niedriger dimensionalen Raum darzustellen.
> >
> > B) Eine Hauptkomponentenanalyse auf Basis der zentrierten
> > Merkmale
> > liefert exakt das gleiche Ergebnis wie eine
> > Hauptkomponentenanalyse
> > auf Basis der standartisierten Merkmale.
> >
> > C) Wenn eine Hauptkomponentenanalyse auf Basis der
> > standartisierten
> > Merkmale durchgeführt wird, dann ist nach dem
> > Kaiser-Kriterium die
> > Anzahl der Hauptkomponenten gleich der Anzahl der
> > Eigenwerte, die
> > größer als 1 sind.
> >
> > D) Wenn die Hauptkomponentenanalyse auf der empirischen
> > Korrelationsmatrix beruht, können Eigenwerte auch negativ
> > sein.
> > Hallo Matheraum!
> >
> >
> > Hinsichtlich der oben gestellten Aufgabe, habe ich den
> > folgenden Lösungsvorschlag:
> >
> >
> >
> > zu a)
> >
> > Hier würde ich mit der folgenden Formal arbeiten:
> >
> >
> > [mm](p-k)^{2}\ge(p+k)[/mm]
>
> Warum? Woher kommt diese Formel? Was ist p und was ist k?
> Du brauchst da gar nichts rechnen, da man max. so viele
> Faktoren extrahieren kann, wie es Variablen gibt (dieser
> Extremfall entsteht dann, wenn alle Variablen untereinander
> unkorreliert sind). Die Antwort ist also 6.
Die Formel habe ich aus dem Skript. Dort steht unter "maximale Faktoranzahl":
[mm] \underbrace{\bruch{1}{2}p(p+1)}_{aus \summe_{}^{}} \ge\underbrace{pk}_{aus L}+\underbrace{p}_{aus \Psi}-\underbrace{\bruch{1}{2}k(k-1)}_{Restriktionen, L^{|}\Psi^{-1}L=\Delta}\Rightarrow(p-k)^{2}\ge(p+k)
[/mm]
Wie erkenne ich, dass es sich hier um den von dir genannten Extremfall handelt? Wie gehe ich vor, wenn dieser Spezialfall nicht vorliegt?
> >
> > Mit k=6 ergibt sich dann durch die pg-Formel [mm]p_{1}=10[/mm] und
> > [mm]p_{2}=3[/mm]
> >
> >
> > Für welchen der beide Werte müsste man sich hier
> > entscheiden? Der Begriff "mindestens" lässt auf [mm]p_{2}=3[/mm]
> > zurückschliessen, oder?
> >
> >
> >
> > zu b)
> >
> > Hier würde ich den Erwartungswert zu
> >
> >
> > [mm]\bruch{1}{5}*\summe_{i=a}^{e}Factor1_{i}=0.562[/mm]
> >
> >
> > errechnen.
> >
>
> Wenn mit Erwartungswert Eigenwert gemeint ist (das sind
> zwei sehr sehr unterschiedliche Begriffe), dann musst du
> nur die Ladungen der Variablen auf den Faktor quadrieren
> und aufsummieren.
Ich habe nochmal nachgesehen, es geht ausdrücklich um den Erwartungswert des ersten Faktors. Könnte man denn so vorgehen, wie ich es getan habe?
> >
> > zu c)
> >
> > [mm]Kommunalitaet_{a}=0.87^{2}+0.10^{2}=0.7669[/mm]
> >
> >
> > [mm]Kommunalitaet_{b}=0.75^{2}+0.20^{2}=0.6025[/mm]
> >
>
> ja!
>
> >
> > zu d)
> >
> > [mm]Uniqueness_{d}=1-(0.72^{2}+0.68^{2})=0.0192[/mm]
> >
> >
> > [mm]Uniqueness_{e}=1-(0.87^{2}+(-0.21)^{2})=0.199[/mm]
>
> ja! Es ist also die durch die 2 Faktoren nicht erlärte
> Varianz.
Okay, also die spezifische Varianz.
> > zu e)
> >
> > Hier habe ich mich für die Antwortmöglichkeiten A,C und D
> > entschieden, auch wenn ich mir nicht wirklich sicher bin.
> > Vielleicht hat hier jemand noch einen
> > Verbesserungsvorschlag.
>
> zu A: das ist richtig
>
> zu B: das ist falsch, weil man eigentlich die
> Kovarianzmatrix in der Hauptkomponentenanalyse analysiert
> (diese ist bei z-Standardisierung mit der Korr-Matrix
> identisch). Zentriert man nur, dann sind die Variablen
> nicht auf einer Metrik und man bekommt andere EIgenwerte
> heraus. Ich glaube das zumindest.
Wie erkennt man hier, dass es sich nicht um die z-Standartisierung handelt? Soweit reichen meine Kenntnisse leider nicht. Du sagst aber, dass die Antwortmöglichkeit aus der Aufgabenstellung falsch ist, oder meinst du meine Antwort dazu?
>
> zu C: das ist richtig
>
> zu D: das kann nicht richtig sein, da Eigenwerte die Summe
> der quadrierten Ladungen auf den Faktor sind, also die
> Summe von stets positiven Werten.
Könntest du das bitte anhand der Zahlen aus der Faktorladung demonstrieren? So wie ich das verstehe, wäre der Eigenwert des ersten Faktors [mm] 0.87^{2}+0.75^{2}+(-0.4)^{2}+0.72^{2}+0.87^{2}=2.7547. [/mm] Wäre das richtig?
In einer Übung wird zunächst eine [mm] R^{Dach}-\Psi^{Dach}-Matrix [/mm] durch ein iteratives Verfahren einer Hauptfaktorenanalyse vorgestellt. Darüberhinaus liefert eine Spektralzerlegung diverse Eigenwerte der entsprechenden Matrix, wobei dort durchaus auch negative Eigenwerte aufgeführt sind. Woran könnte das dann liegen?
> Ich hoffe, dass das dir hilft.
Ja, das war in jedem Fall schon mal ein Fortschritt; danke schön!
> Grüße, Steffen
>
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:20 Sa 06.02.2010 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Wäre natürlich schön, wenn sich das jemand doch nochmal anschauen könnte. Vielen Dank!
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:20 Mo 08.02.2010 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Nach wie vor habe ich Interesse an einer Antwort zu diesem Thread, danke schön!
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 10:20 Do 11.02.2010 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Ich beschränke mich in einer neuen Version auf die beiden wichtigsten Fragen. Wäre schön, wenn sich das jemand anschauen könnte.
Gruß, Marcel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 00:20 Mi 17.02.2010 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|