Definition Freiheitsgrade < Wahrscheinlichkeitstheorie < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo,
bei mir steht:
"Seien [mm] {Z_1}^2, [/mm] ..., [mm] {Z_m}^2 [/mm] unabhängige und standardnormalverteilte Zufallsvariablen. Dann heißt die Verteilung der Zufallsvariablen
X = [mm] {Z_1}^2 [/mm] + ... + [mm] {Z_m}^2
[/mm]
Chi-Quadrat-Verteilung mit m Freiheitsgraden ..."
Weiter unten steht dann:
"Die Anzahl der Freiheitsgrade einer Zufallsvariablen kann man sich als die Anzahl der "frei" verfügbaren Beobachtungen vorstellen: Das ist der Stichprobenumfang n minus der Anzahl der aus der Stichprobe geschätzten Parameter. Wenn man zum Beispiel die Summe aus drei Messwerten kennt, dann lassen sich zwei Messwerte frei wählen. Der dritte ist nicht frei wählbar, da er durch die vorgegebene Summe festgelegt ist. Von n Messwerten, deren Summe bekannt ist, sind also n - 1 frei wählbar. Daher ist zum Beispiel n - 1 der Freiheitsgrad der Varianz."
Also nach dem Beispiel mit der "Summe aus drei Messwerten" frage ich mich, wieso dann der Freiheitsgrad der vorgenannten Chi-Quadrat-Verteilung gleich m sein sollte. Wenn ich die Summe (also X) kenne, dann lassen sich doch auch parallel dazu nur m - 1 Werte frei wählen, da der m-te durch die Summe X festgelegt ist.
Kann man das auch noch besser erklären? Was soll das überhaupt mit dem "Schätzen"?
Viele Grüße,
Martin
|
|
|
|
Du hast Recht, wenn die Summe bekannt ist. Ist diese aber auch frei wählbar, wäre der Freiheitsgrad m. Hier noch ein typisches Beispiel:
Studenten vom 1. - 3. Semester werden nach ihrer Wohnsituation befragt.
bei Eltern Studentenheim private Bude Summe
Semester
1 256 88 22 366
2 188 102 70 360
3 78 92 132 302
Summe 522 282 224 1028
Fragestellung: Hängt die Wohnsituation vom Semester ab?
Die Summen am Rand (unten und rechts) haben nichts mit dieser Abhängigkeit zu tun: Es sind nun mal 366 bzw. 360 bzw. 302 in den verschiedenen Semestern und 522 bzw. 288 bzw.224 wohnen da und da. Die Untersuchung bezieht sich damit auf das 3x3-Feld links oben. Wenn man in einer Zeile oder Spalte zwei der Zahlen auswählt, ist die dritte durch die Randsumme festgelegt. Deshalb hast du hie einen Chi-Quadrat-Test mit 2X2=4 Freiheitsgraden.
|
|
|
|
|
Hiho,
> Also nach dem Beispiel mit der "Summe aus drei Messwerten"
> frage ich mich, wieso dann der Freiheitsgrad der
> vorgenannten Chi-Quadrat-Verteilung gleich m sein sollte.
> Wenn ich die Summe (also X) kenne, dann lassen sich doch
> auch parallel dazu nur m - 1 Werte frei wählen, da der
> m-te durch die Summe X festgelegt ist.
Wie HJKWeseleit ja bereits erklärt hat, hast du dann ja insgesamt m freie wählbare Parameter, wenn du die Summe bereits frei gewählt hast
X + (m-1) Werte
> Kann man das auch noch besser erklären? Was soll das überhaupt mit dem "Schätzen"?
"Schätzen" hat nix mit dem Umgangssprachlichen "schätzen" im Sinne von "pi mal Daumen" zu tun, sondern damit aus unvollständigen Informationen die bestmögliche Annäherung zu finden.
Wenn du bspw. weißt, dass deine Zufallsvariable einer Normalverteilung folgt, weißt aber nicht mit welchem Mittelwert und/oder Varianz, dann bleibt dir nichts anders übrig als diese beiden Werte zu schätzen… und zwar anhand der Werte, die du herausbekommst.
Gruß,
Gono
|
|
|
|
|
Hallo,
eins vorneweg: Ich hab mir die beiden Antworten durchgelesen, aber mir ist immer noch nicht klar, worum es hierbei geht.
> Wenn du bspw. weißt, dass deine Zufallsvariable einer
> Normalverteilung folgt, weißt aber nicht mit welchem
> Mittelwert und/oder Varianz, dann bleibt dir nichts anders
> übrig als diese beiden Werte zu schätzen… und zwar
> anhand der Werte, die du herausbekommst.
Tut mir leid, aber ich verstehe nicht, wie das mit der Aussage zusammenpasst, die ich nochmal hier einfüge:
"Die Anzahl der Freiheitsgrade einer Zufallsvariablen kann man sich als die Anzahl der "frei" verfügbaren Beobachtungen vorstellen: Das ist der Stichprobenumfang n minus der Anzahl der aus der Stichprobe geschätzten Parameter. Wenn man zum Beispiel die Summe aus drei Messwerten kennt, dann lassen sich zwei Messwerte frei wählen. Der dritte ist nicht frei wählbar, da er durch die vorgegebene Summe festgelegt ist. Von n Messwerten, deren Summe bekannt ist, sind also n - 1 frei wählbar. Daher ist zum Beispiel n - 1 der Freiheitsgrad der Varianz."
Also: Der Freiheitsgrad (f) ist der Stichprobenumfang (n) minus der Anzahl (s) der aus der Stichprobe "geschätzten" Parameter:
f = n - s (1)
Dann wird davon geredet, dass bei Stichprobenumfang n = 3 und bekannter Summe der Freheitsgrad f = 2 beträgt.
Jetzt setze ich n = 3 und f = 2 in in (1) ein:
2 = 3 - s
Also
s = 3 - 2 = 1
Und was ist jetzt dieser eine "geschätzte" Parameter? Die Summe ist es doch wohl nicht, denn die ist ja bekannt ("Wenn man zum Beispiel die Summe aus drei Messwerten kennt ...") und somit wohl kaum "geschätzt"!?
Bin ich zu doof oder ist das schlecht geschrieben?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 10:53 Mo 13.04.2020 | Autor: | meili |
Hallo Sancho 1980,
> Hallo,
>
> eins vorneweg: Ich hab mir die beiden Antworten
> durchgelesen, aber mir ist immer noch nicht klar, worum es
> hierbei geht.
>
> > Wenn du bspw. weißt, dass deine Zufallsvariable einer
> > Normalverteilung folgt, weißt aber nicht mit welchem
> > Mittelwert und/oder Varianz, dann bleibt dir nichts anders
> > übrig als diese beiden Werte zu schätzen… und zwar
> > anhand der Werte, die du herausbekommst.
>
Noch eine Anmerkung zu:
"Seien $ [mm] {Z_1}^2, [/mm] $ ..., $ [mm] {Z_m}^2 [/mm] $ unabhängige und standardnormalverteilte Zufallsvariablen. Dann heißt die Verteilung der Zufallsvariablen
X = $ [mm] {Z_1}^2 [/mm] $ + ... + $ [mm] {Z_m}^2 [/mm] $
Chi-Quadrat-Verteilung mit m Freiheitsgraden ..."
müsste das nicht heißen:
"Seien $ [mm] {Z_1}, [/mm] $ ..., $ [mm] {Z_m} [/mm] $ unabhängige und standardnormalverteilte Zufallsvariablen. Dann heißt die Verteilung der Zufallsvariablen
X = $ [mm] {Z_1}^2 [/mm] $ + ... + $ [mm] {Z_m}^2 [/mm] $
Chi-Quadrat-Verteilung mit m Freiheitsgraden ..."
Das Problem wird sein, bei der Chi-Quadrat-Verteilung ist das X von oben unbekannt und soll bestimmt werden.
Bei dem Beispiel mit der Summe aus 3 Summanden ist aber die Summe
bekannt, und einer der Summanden soll bestimmt werden.
> Tut mir leid, aber ich verstehe nicht, wie das mit der
> Aussage zusammenpasst, die ich nochmal hier einfüge:
>
> "Die Anzahl der Freiheitsgrade einer Zufallsvariablen kann
> man sich als die Anzahl der "frei" verfügbaren
> Beobachtungen vorstellen: Das ist der Stichprobenumfang n
> minus der Anzahl der aus der Stichprobe geschätzten
> Parameter. Wenn man zum Beispiel die Summe aus drei
> Messwerten kennt, dann lassen sich zwei Messwerte frei
> wählen. Der dritte ist nicht frei wählbar, da er durch
> die vorgegebene Summe festgelegt ist. Von n Messwerten,
> deren Summe bekannt ist, sind also n - 1 frei wählbar.
> Daher ist zum Beispiel n - 1 der Freiheitsgrad der
> Varianz."
>
> Also: Der Freiheitsgrad (f) ist der Stichprobenumfang (n)
> minus der Anzahl (s) der aus der Stichprobe "geschätzten"
> Parameter:
>
> f = n - s (1)
>
> Dann wird davon geredet, dass bei Stichprobenumfang n = 3
> und bekannter Summe der Freheitsgrad f = 2 beträgt.
>
> Jetzt setze ich n = 3 und f = 2 in in (1) ein:
>
> 2 = 3 - s
>
> Also
>
> s = 3 - 2 = 1
>
> Und was ist jetzt dieser eine "geschätzte" Parameter? Die
> Summe ist es doch wohl nicht, denn die ist ja bekannt
> ("Wenn man zum Beispiel die Summe aus drei Messwerten kennt
> ...") und somit wohl kaum "geschätzt"!?
Bei dem Beispiel 3 Summanden und der dazugehörigen Summe, die bekannt ist, ist der geschätzte Parameter einer der Summanden.
>
> Bin ich zu doof oder ist das schlecht geschrieben?
Gruß
meili
|
|
|
|
|
Hallo,
> müsste das nicht heißen:
> "Seien [mm]{Z_1},[/mm] ..., [mm]{Z_m}[/mm] unabhängige und
> standardnormalverteilte Zufallsvariablen. Dann heißt die
> Verteilung der Zufallsvariablen
>
> X = [mm]{Z_1}^2[/mm] + ... + [mm]{Z_m}^2[/mm]
>
> Chi-Quadrat-Verteilung mit m Freiheitsgraden ..."
Jupp, mein Fehler.
> Bei dem Beispiel 3 Summanden und der dazugehörigen Summe,
> die bekannt ist, ist der geschätzte Parameter einer der
> Summanden.
Kannst du mir dann erklären, was es mit dem letzten Satz auf sich hat:
"Daher ist zum Beispiel n - 1 der Freiheitsgrad der Varianz."
Mir ist nicht ganz klar, ob hier von der empirischen Varianz
[mm] s^2 [/mm] = [mm] \bruch{1}{n-1}\summe_{i=1}^{n}(x_i [/mm] - [mm] \overline{x})
[/mm]
oder der Varianz der genannten Zufallsvariablen X
Var(X) = E((X - [mm] \mu)^2)
[/mm]
die Rede ist.
Für die empirische Varianz spricht, dass hier von Stichproben die Rede ist. Andererseits wird hier zunächst vom Freiheitsgrad der Verteilung der Zufallsvariablen X (= Anzahl der Summanden) und dann vom Freiheitsgrad der Varianz (= Anzahl der Summanden minus eins) geredet. Wie passt denn das zusammen? Schon klar, wenn ich die Varianz kenne, ergibt sich genau ein Summand aus den übrigen Werten; ein Gleichungssystem mit einer Gleichung und einer Unbekannten eben. Das gilt sowohl für die genannte Zufallsvariable X als auch für die Varianz. Wieso sind dann die Freiheitsgrade nicht gleich?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 23:40 Do 16.04.2020 | Autor: | meili |
Hallo sancho1980,
> Hallo,
>
> > müsste das nicht heißen:
> > "Seien [mm]{Z_1},[/mm] ..., [mm]{Z_m}[/mm] unabhängige und
> > standardnormalverteilte Zufallsvariablen. Dann heißt die
> > Verteilung der Zufallsvariablen
> >
> > X = [mm]{Z_1}^2[/mm] + ... + [mm]{Z_m}^2[/mm]
> >
> > Chi-Quadrat-Verteilung mit m Freiheitsgraden ..."
>
> Jupp, mein Fehler.
>
> > Bei dem Beispiel 3 Summanden und der dazugehörigen Summe,
> > die bekannt ist, ist der geschätzte Parameter einer der
> > Summanden.
>
> Kannst du mir dann erklären, was es mit dem letzten Satz
> auf sich hat:
>
> "Daher ist zum Beispiel n - 1 der Freiheitsgrad der
> Varianz."
>
> Mir ist nicht ganz klar, ob hier von der empirischen
> Varianz
>
> [mm]s^2[/mm] = [mm]\bruch{1}{n-1}\summe_{i=1}^{n}(x_i[/mm] - [mm]\overline{x})[/mm]
>
> oder der Varianz der genannten Zufallsvariablen X
>
> Var(X) = E((X - [mm]\mu)^2)[/mm]
>
> die Rede ist.
>
Ja, n -1 Freiheitsgrade gilt für die empirische Varianz.
> Für die empirische Varianz spricht, dass hier von
> Stichproben die Rede ist. Andererseits wird hier zunächst
> vom Freiheitsgrad der Verteilung der Zufallsvariablen X (=
> Anzahl der Summanden) und dann vom Freiheitsgrad der
> Varianz (= Anzahl der Summanden minus eins) geredet. Wie
> passt denn das zusammen? Schon klar, wenn ich die Varianz
> kenne, ergibt sich genau ein Summand aus den übrigen
> Werten; ein Gleichungssystem mit einer Gleichung und einer
> Unbekannten eben. Das gilt sowohl für die genannte
> Zufallsvariable X als auch für die Varianz. Wieso sind
> dann die Freiheitsgrade nicht gleich?
Hier ist der Zusammenhang von Chi-Quadrat-Verteilung und
Stichprobenvarianz Herleitung der Verteilung der Stichprobenvarianz.
Gruß
meili
|
|
|
|