Konfidenzintervalle < Statistik/Hypothesen < Stochastik < Oberstufe < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 09:12 Sa 10.11.2012 | Autor: | hase-hh |
Aufgabe | Ein Würfel wird 600 mal geworfen. Es soll überprüft werden, ob die Wahrscheinlichkeit eine 6 zu würfeln tatsächlich [mm] \bruch{1}{6} [/mm] beträgt.
Wie lautet das 90%-Konfidenzintervall?
bzw. Wie groß ist der Annahmebereich für [mm] \alpha [/mm] = 10% ? |
Moin,
also ich weiss
X: Anzahl gewürfelter Sechsen.
p= [mm] \bruch{1}{6} [/mm] n= 600
[mm] \mu [/mm] = 100 [mm] \sigma =\wurzel{\bruch{500}{6}}
[/mm]
Konfidenz-Intervall: [mm] [\mu [/mm] - [mm] c*\simga [/mm] ; [mm] \mu [/mm] + [mm] c*\sigma]
[/mm]
für 90% ist c = 1,64 (zweiseitiger Test)
=> [100 - [mm] 1,64*\wurzel{\bruch{500}{6}} [/mm] ; 100 + [mm] 1,64*\wurzel{\bruch{500}{6}} [/mm] ]
[85,03 ; 114,97]
[86 ; 114]
Bei Rechnung mit der Normalverteilung weicht der Annahmebereich geringfügig von diesem Ergebnis ab. [87; 114]
Meine Frage: Müsste ich beim Bilden des Konfidenzintervalls nicht auch eine Stetigkeitskorrektur machen?
Danke & Gruß!
|
|
|
|
Hallo,
> Meine Frage: Müsste ich beim Bilden des
> Konfidenzintervalls nicht auch eine Stetigkeitskorrektur
> machen?
nein (wie möchtest du das anstellen, etwa 85,5-mal würfeln? ). Hier muss man nur das erhaltene Ergebnis richtig interpretieren. Da die Anzahl der Würfe endlich ist, ist es eigentlich klar, dass man mit keinem Intervall die 90% genau 'trifft'. Insofern ist [86;114] das größte Intervall, für welches das Konfidenzniveau gerade noch größer als 90% ist.
Gruß, Diophant
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 15:08 Sa 10.11.2012 | Autor: | hase-hh |
Moin,
nun wie ich das machen möchte, bspw. so:
[ 100 -0,5 - [mm] 1,64*\wurzel{\bruch{500}{6}} [/mm] ; 100 +0,5 + [mm] \wurzel{\bruch{500}{6}} [/mm] ]
und das Ergebnis dann natürlich ganzzahlig runden...
[ 84,52 ; 115,02 ]
[ 85; 115 ]
Wie gesagt ich bekomme über die NV (mit Stetigkeitskorrektur) einen Ablehungsbereich von [0; 86] und [115... 600].
Ist das Konfidenzintervall eigentlich prinzipiell genauer als der Weg über die NV?
Danke & Gruß
|
|
|
|
|
Hallo,
du hast zwei Dinge noch nicht ganz verstanden:
- Sinn und Zweck der Stetigkeitskorrektur
- den Begriff des Konfidenzintervalls.
Stetigkeitskorrektur wendet man immer dort an, wo man eine diskrete Summe durch ein Integral annähert. Das ist hier nicht direkt der Fall, was du hir machst, ist den Mittelwert des Intervalls 'aufzublähen'. Hierdurch wird dein Intervall vergrößert und das kann nicht gewollt sein.
Deine Frage zu Konfidenzintervall vs. Normalverteilung kann man eigentlich nur sagen, dass sie sich überhaupt nicht stellt. Die Formel, mit der du hier für die Intervallschranken arbeitest basiert auf der Normalverteilung. Und viel wichtiger: du machst hier beurteilende Statistik. Das bedeutet, du kennst die zu Grunde liegenden Parameter nicht, sondern du möchtest diese auf Basis einer Stichprobe bestimmen. Da dies exakt nur mit einer unendlich großen Stichprobe möglich ist, kann man nicht mehr tun als zu sagen: dieser oder jener Parameter liegt mit einer bestimmten Wahrscheinlichkeit in einem berechneten Intervall. Eben dies ist das Konfidenzintervall.
Gruß, Diophant
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 19:09 Sa 10.11.2012 | Autor: | hase-hh |
Moin,
> Hallo,
>
> du hast zwei Dinge noch nicht ganz verstanden:
>
> - Sinn und Zweck der Stetigkeitskorrektur
> - den Begriff des Konfidenzintervalls.
>
> Stetigkeitskorrektur wendet man immer dort an, wo man eine
> diskrete Summe durch ein Integral annähert. Das ist hier
> nicht direkt der Fall, was du hir machst, ist den
> Mittelwert des Intervalls 'aufzublähen'. Hierdurch wird
> dein Intervall vergrößert und das kann nicht gewollt
> sein.
Ist das Konfidenzintervall nicht auch ein "Stück" einer BV, die durch eine NV
angenähert wird?
Was meinst Du mit, "das kann nicht gewollt sein" ?
> Deine Frage zu Konfidenzintervall vs. Normalverteilung kann
> man eigentlich nur sagen, dass sie sich überhaupt nicht
> stellt. Die Formel, mit der du hier für die
> Intervallschranken arbeitest basiert auf der
> Normalverteilung.
Das würde doch meine Frage nahelegen, oder nicht?
Die [mm] \sigma-Umgebung [/mm] resultiert doch aus der NV, oder sehe ich das falsch?
Jedenfalls komme ich über die NV und die NV-Tabelle, als auch über das Konfidenzintervall und die Tabelle "Wahrscheinlichkeiten für [mm] \sigma-Umgebungen [/mm] bei normalverteilten Zufallsgrößen [mm] P=P(\mu [/mm] - [mm] z*\sigma; \mu [/mm] + [mm] z*\sigma) [/mm] für [mm] \sigma [/mm] < 3" auf dasselbe z.
Somit müssten eigentlich beide Wege Annährungen der BV durch die NV beinhalten.
> Und viel wichtiger: du machst hier
> beurteilende Statistik. Das bedeutet, du kennst die zu
> Grunde liegenden Parameter nicht, sondern du möchtest
> diese auf Basis einer Stichprobe bestimmen. Da dies exakt
> nur mit einer unendlich großen Stichprobe möglich ist,
> kann man nicht mehr tun als zu sagen: dieser oder jener
> Parameter liegt mit einer bestimmten Wahrscheinlichkeit in
> einem berechneten Intervall. Eben dies ist das
> Konfidenzintervall.
In vielen Aufgaben, wie meine, sind m.W. beide Methoden üblich.
Daher meine Frage, welche die "bessere" Näherung liefert?! Und warum es zu (leicht) abweichenden Ergebnissen kommt / kommen kann?
Einig sind wir uns ja sicher darin, dass hier ein diskrete ZV betrachtet wird, und daher keine Stetigkeit gegeben ist.
Oder ist es falsch, diese Aufgabe mithilfe eines Konfidenzintervalls zu lösen?
|
|
|
|
|
Hallo,
> Ist das Konfidenzintervall nicht auch ein "Stück" einer
> BV, die durch eine NV
> angenähert wird?
Ja schon, aber das ist nicht die Frage. Du gehst wie selbstverständlich davon aus, dass bei deinem Experiment der Mittelwert 100 von vornherein gegeben ist. Dem ist aber in diesem Falle nicht so (sonst könnte man sich das Experiment sparen). Auch wenn es in diesem Beispiel schwer nachvollziehbar ist: das hier ist beurteilende Statistik, nicht beschreibende. Die Motivation lautet in diesem Fall, sagen zu können, dass auf Grund der Gegebenheiten des Würfels der Mittelwert des Experimentes, wenn man es so durchführt, mit mindestens 90%er Wahrscheinlichkeit in dem ermittelten Bereich liegen sollte. Damit kann sich dann in der Praxis beipielsweise eine Nullhypothese bilden lassen.
>
> Was meinst Du mit, "das kann nicht gewollt sein" ?
>
Nochmals: ob diskret oder stetig, ein Mittelwert ist stets ein diskreter Wert. Der einzige Effekt, den deine sog. Stetigkeitskorrektur hat, ist dass das Ergebnis verfälscht wird weil sich das Intervall vergrößert. Damit steigt das Konfidenzniveau, und das kann nicht gewollt sein. Sonst könnte man ja gleich sagen, der Mittelwert liegt mit 100%er Sicherhit zwischen 0 und 600.
> > Deine Frage zu Konfidenzintervall vs. Normalverteilung kann
> > man eigentlich nur sagen, dass sie sich überhaupt nicht
> > stellt. Die Formel, mit der du hier für die
> > Intervallschranken arbeitest basiert auf der
> > Normalverteilung.
>
> Das würde doch meine Frage nahelegen, oder nicht?
>
> Die [mm]\sigma-Umgebung[/mm] resultiert doch aus der NV, oder sehe
> ich das falsch?
Nein, nicht generell. [mm] \sigma-Umgebungen [/mm] werden auch bei anderen Verteilungen verwendet, und was sind sie denn anderes als ein Konfidenzintervall?
> Jedenfalls komme ich über die NV und die NV-Tabelle, als
> auch über das Konfidenzintervall und die Tabelle
> "Wahrscheinlichkeiten für [mm]\sigma-Umgebungen[/mm] bei
> normalverteilten Zufallsgrößen [mm]P=P(\mu[/mm] - [mm]z*\sigma; \mu[/mm] +
> [mm]z*\sigma)[/mm] für [mm]\sigma[/mm] < 3" auf dasselbe z.
>
> Somit müssten eigentlich beide Wege Annährungen der BV
> durch die NV beinhalten.
Das kann schon sein, aber da müsstest du deine Rechnung angeben, damit man es nachvollziehen kann.
> > Und viel wichtiger: du machst hier
> > beurteilende Statistik. Das bedeutet, du kennst die zu
> > Grunde liegenden Parameter nicht, sondern du möchtest
> > diese auf Basis einer Stichprobe bestimmen. Da dies exakt
> > nur mit einer unendlich großen Stichprobe möglich ist,
> > kann man nicht mehr tun als zu sagen: dieser oder jener
> > Parameter liegt mit einer bestimmten Wahrscheinlichkeit in
> > einem berechneten Intervall. Eben dies ist das
> > Konfidenzintervall.
>
> In vielen Aufgaben, wie meine, sind m.W. beide Methoden
> üblich.
Das sind keine 'Methoden' sondern Blickrichtungen. In der angewandten Stochastik geht es ja so gut wie immer darum, gesammelte Daten auf eine bestimmte Fragestellung hin zu interpretieren. Dabei spielen Konfidenzintervalle eine grundlegende und wichtige Rolle.
>
> Daher meine Frage, welche die "bessere" Näherung liefert?!
> Und warum es zu (leicht) abweichenden Ergebnissen kommt /
> kommen kann?
Wie gesagt, im Grunde genommen handelt es sich in beiden Fällen um die gleiche Methode. Leicht abweichende Ergebnisse können bspw. entstehen, wenn man bei der Normalverteilung mit Tabellenwerten mit wenigen Nachkommastellen rechnet.
>
> Einig sind wir uns ja sicher darin, dass hier ein diskrete
> ZV betrachtet wird, und daher keine Stetigkeit gegeben ist.
>
> Oder ist es falsch, diese Aufgabe mithilfe eines
> Konfidenzintervalls zu lösen?
Nein, das kann nicht falsch sein, wenn in der Aufgabenstellung danach gefragt wird.
Gruß, Diophant
|
|
|
|