Forum "Uni-Stochastik" - Berechnung Wahrscheinlichkeit - MatheRaum - Offene Informations- und Vorhilfegemeinschaft

Raum für Mathematik Offene Informations- und Nachhilfegemeinschaft Für Schüler, Studenten, Lehrer, Mathematik-Interessierte.
	Hallo Gast! [ einloggen \| registrieren ]
	Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum

Forenbaum

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation

Startseite...
Neuerdings beta neu
Forum...
vorwissen...
vorkurse...
Werkzeuge...
Nachhilfevermittlung beta...
Online-Spiele beta
Suchen
Verein...
Impressum

Das Projekt

Server und Internetanbindung werden durch Spenden finanziert.

Organisiert wird das Projekt von unserem Koordinatorenteam.

Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.

Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".

Partnerseiten

Weitere Fächer:

Vorhilfe.de

FunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme

Startseite > MatheForen > Uni-Stochastik > Berechnung Wahrscheinlichkeit

Foren für weitere Schulfächer findest Du auf www.vorhilfe.de z.B. Deutsch • Englisch • Französisch • Latein • Spanisch • Russisch • Griechisch

Forum "Uni-Stochastik" - Berechnung Wahrscheinlichkeit

Berechnung Wahrscheinlichkeit < Stochastik < Hochschule < Mathe < Vorhilfe

Ansicht:

[ geschachtelt ]

Forum "Uni-Stochastik" |

Alle Foren |

Forenbaum | Materialien

Berechnung Wahrscheinlichkeit: Abstimmung / Meinungsumfrage

Status:	(Frage) beantwortet
Datum:	14:05 So 18.06.2006
Autor:	Martin_Messmer

Aufgabe

 Liebe Mathematikerinnen und Mathematiker

Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt. Die Antworten werden ausschliesslich privat genossen  !!

Nun:

Polling ist eine Umfragetechnik: Es stehen zwei Projekte zur Auswahl, A und B. Es ist den Stimmberechtigten erlaubt, 'nur A', 'nur B', 'beide' oder 'keines' zu wählen. Meine Frage an einem Beispiel:

75 Stimmberechtigte (n)

12 wählten NUR A (A)

6 wählten NUR B (B)

49 wählten A UND B (AuB)

8 wählten weder A noch B (-A-B)

Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.

Frage:

Mit welcher Wahrscheinlichkeit (in %) würde Projekt A auch DANN gewählt, wenn unendlich viele Leute darüber abstimmen würden (statt n Leute unendlich viele)?
Oder anders:
Wie relevant ist dieses Abstimmungsergebnis bei nur 75 Stimmberechtigten; wie eindeutig ist dieses Ergebnis?
Allgemein:
Wie wahrscheinlich ist es, dass bei einer solchen Umfrage (polling) das Ergebnis relevant (nicht zufällig) ist?

Ein wünschenswertes Ergebnis würde z.B. folgendermassen lauten:

"Mit 87% Sicherheit ist dieses Ergebnis NICHT zufällig, wurde A NICHT zufällig gewählt."

Ich kenne die nötigen Verfahren, dies ALLGEMEIN (für jedes Wahlresultat eines solchen Pollings) zu bestimmen, leider zu wenig und danke herzlich für jedes Mitdenken und jede Antwort.

Ein guter Tag

Martin Messmer
(Schweiz)

Bezug

Berechnung Wahrscheinlichkeit: Idee des Verfassers ...

Status:	(Mitteilung) Reaktion unnötig
Datum:	11:14 Mi 21.06.2006
Autor:	Martin_Messmer

Liebe Leserinnen und Leser

Ich habe einen Ansatz für mein Problem, weiss aber nicht, ob er gut ist:

Es sei A = Anzahl Stimmen NUR für A
Es sei B = Anzahl Stimmen NUR für B

Dann ist

z = (ABS(A - B) - 1) / Wurzel aus (A + B)
Die Wahrscheinlichkeit, wie sicher das Wahlergebnis auch in einer grösseren Grundgesamtheit für dasselbe Projekt ausfallen würde, ist aus z ableitbar:

für z = 0     ist F(z) = 50%
für z = 0.98  ist F(z) = 83.65%   oder brühmt:
für z = 1.96  ist F(z) = 97.5%
für z = 2.36  ist F(z) = 99.09%
für z = unendl.:  F(z) = 100%

Fragen:
1) liege ich mit meinem Ansatz im Schhilf?
2) wie finde ich aus z den Wert F(z)?

Danke für jede Hilfe

Martin Messmer

Bezug

Berechnung Wahrscheinlichkeit: Antwort

Status:	(Antwort) fertig
Datum:	12:45 Mi 21.06.2006
Autor:	Walde

Hi Martin,

deinen Ansatz vertehe ich überhaupt nicht (was aber nichts heissen muss ;-)

). Wie kommst du z.B. auf F(z) als Wahrscheinlichkeit dafür, dass bei höherem n dieselbe Verteilung der Stimmen in die Kategorien vorliegt? Falls du mit ABS(A-B), |A-B|, den Betrag meinst, ist z=0, falls A und B sich um 1 unterscheiden. Welche besondere Bedeutung hat das und wie kommst du dann auf F(0)=0,5 ? Scheint mir alles wie aus der Luft gegriffen.

Aber ich glaube, ich kann dir weiterhelfen:

Wenn ich dich richtig verstanden habe, möchtest du wissen, ob dein Ergebnis zufällig ist, was heisst das?
Da du 4 Kategorien zur Auswahl hast, müsste bei einem zufälligen Ergebnis jeder Kategorie 25% der Stimmen zufallen. Natürlich können zufällige Schwankungen auftreten. Die Frage ist also, sind die Schwankungen zufällig (von 25/25/25/25) oder statistisch signifikant (weil in Wirklichkeit eine ganz andere Verteilung vorliegt).

Eine solche Frage kann man mit einem

Chi-Quadrat-Anpassungstest überprüfen.

Du musst dabei übrigens nicht von einer gleichmässigen Verteillung auf die Kategorien ausgehen. Du kannst auch testen, ob dein Ergebnis signifikant von (zum Beispiel) 20/20/50/10 abweicht, usw.

Falls du dich mit statistischen Tests überhaupt nicht auskennst, empfehle ich zunächst eine Wikipedia-suche damit du gewisse Begriffe (z.B. Hypothese, Irrtumswahrscheinlichkeit, Quantil) schon mal gehört hast, ehe du hier weiter fragst. Ansonsten helfen wir dir natürlich weiter.

L G walde

Bezug

Berechnung Wahrscheinlichkeit: Danke - und Erklärungsversuch

Status:	(Mitteilung) Reaktion unnötig
Datum:	16:57 Mi 21.06.2006
Autor:	Martin_Messmer

Lieber Walde

Herzlichen Dank für Deine Antwort. Nun ...

Zuerst, wie ich von z auf F(z) komme:

F(z) =  [mm] \integral_{-unendlich}^{z}{1/ \wurzel{2* \pi}* e^{- t^{2}/2} dt} [/mm]

Und - es ist eben NICHT abzuwägen, inwieweit das Wahlergebnis von 25%/25%/25%/25% abweicht, da dies nicht als Grundausgangslage betrachtet werden kann. Die Frage ist:

Wenn eine Gruppe von Menschen (z.B. 75 Leute) sich folgendermassen für A entscheidet:
- 12 NUR für A
-  6 NUR für B
- 49 für A UND B  und
-  8 Enthaltungen,
wie gross dann die Wahrscheinlichkeit ist, dass in einer unendlich grossen Grundmenge EBENFALLS für A entschieden würde.

F(z) = 50% ergibt sich dann, wenn z.B. A nur mit einer einzigen Stimme mehr als für B gewählt wurde. Dann besagt in solchem Fall dieses F(z) = 50%, dass die Chancen, dass in einer anderen, grösseren Gruppe ebenfalls das A gewählt würde, 50:50 steht...

Die Formel z = (Absoluter Betrag von (A - B) - 1) /  [mm] \wurzel{A + B} [/mm] habe ich in bei folgender Aufgabenstellung gefunden:

Wenn zwei Aufgaben von SchülerInnen gelöst werden müssen, dann ist anhand des Ergebnisses (gewisse SchülerInnen lösen nur A, andere nur B, dritte beide und schliesslich andere keine der Aufgaben) abzuschätzen,  mit welcher Wahrscheinlichkeit die eine Aufgabe effektiv schwieriger ist als die andere. Da gelte die obige Formel für z. Signifikant unterschiedlichen Schwierigkeitsgrades sollen die Aufgaben DANN sein, wenn F'(z)  [mm] \ge [/mm] 0.95 sei. Allerdings rechnete diese Formel von 0% bis 100%, somit unterscheidet sich dieses F'(z) von 'meinem' F(z) wie folgt:

F'(z) = 2*F(z) - 1

Der Chiquadrat-Test - denkst Du, dass dieser das Geheimnis für diese meine Aufgabe ist? Ich werde einmal nachschauen, was dieser Test testet.

Ganz herzlichen Dank jedenfalls für Deine Hilfe bis dahin.
Hoffentlich habe ich Dich nun nicht verwirrt :-)

- und - DANKE für weitere Hilfe!

Ein ganz guter Abend

Martin

Bezug

Berechnung Wahrscheinlichkeit: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	00:45 Do 22.06.2006
Autor:	Walde

Hi Martin,

ok, ich werde nochmal drüber nachdenken, aber ein paar Fragen/Anmerkungen hab ich direkt.
Bei deinem Beispiel wird ja die Hypothese aufgestellt, dass die Schwierigkeiten der Aufgaben gleich sind. Diese wird abgelehnt, wenn der Wert deiner Teststatistik z signifikant gross wird. Das hört sich bislang nach einer ganz normalen Testvorschrift an. Eine Hypothese, wird abgelehnt oder nicht. Da gibts ja erstmal nix mit "wie wahrscheinlich ist, dass sich das wiederholt".

Dazu noch eine Frage: wie genau ist F'(z) definiert ( was äquivalent zu der Frage ist, wie ist die Teststatistik z verteilt). Dein F, das du gewählt hast ist ja anscheinend die Verteilungsfunktion der Standardnormalverteilung und wenn F und F' ( du meinst wohl nicht die Ableitung) zusammenhängen, wird anscheinend davon ausgegangen, dass die Teststatistik z auch Standardnormalverteilt ist.
Je genauer du die Aufgabe postest, desto besser kann ich erkennen, was die gemacht haben.

Wenn du WEISST, dass eine bestimmte Verteilung zu Grunde liegt, zb. 12/75 der Leute wählen A und du erhöhst die Stichprobe, dann wirst du ziemlich dicht dran liegen, je mehr Leute, desto näher dran (Prozentual) natürlich nicht EXAKT treffen.

Wenn du nichts über die Verteilung weisst, dann kannst du höchstens eine Vermutung (Hypothese) Testen, je grösser auch hier die Stichprobe, desto besser der Test.

Wenn du keinerlei Ahnung hast, die du Testen kannst, kannst du dein Ergebnis als Schätzwerte benutzen. Die werden auch mit Erhöhung der Stichprobe besser.

Um eine W'keit auszurechnen, brauchst du eine Zufallsvariable die eine bestimmte Verteilung hat und ein Ereignis, dessen W'keit du ausrechnen willst. So läuft das bei Tests. Deshalb habe ich so Schwierigkeiten zu verstehen warum dein Ansatz das Gewünschte liefern soll. Du müsstest versuchen die Worte "Mit welcher Wahrscheinlichkeit (in %) würde Projekt A auch DANN gewählt, wenn unendlich viele Leute darüber abstimmen würden (statt n Leute unendlich viele)? " in Formeln zu fassen. Das ist nämlich was anderes würde ich sagen als "Mit 87% Sicherheit ist dieses Ergebnis NICHT zufällig, wurde A NICHT zufällig gewählt".

Ein simpleres Beispiel:
Ich könnte 10 mal eine Münze werfen und fragen: " Ist es Zufall, dass 10 mal Wappen kam, oder ist sie gefälscht?" Wenn es wirklich Zufall war, dann lag die W'keit (weil sie ja dann in Wahrheit unverfälscht war, also [mm] p_{wappen}=0,5, [/mm] bei 0,5^10. Ein statistischer Test würde mir allerdings eine Ablehnung der Hypothese "Münze ist unverfälscht" bringen.

Du kannst aber nur etwas über die W'keit, dass sich das wiederholt sagen, wenn du eine Annahme über die tatsächliche W'keit für Wappen machst. z.B. n=20: Unter der Annahme, dass [mm] p_W=0,9, [/mm] hast du [mm] P(X=18)=\vektor{20 \\ 18}*0,9^{18}*0,1^2 [/mm] (X ist in diesem Fall Binomialverteilt).

Das wird mit wachsendem n immer natürlich immer kleiner (und nährt sich Null). Besser ist es nach einem Intervall zu fragen.z.B P(850 [mm] \le [/mm] X [mm] \le [/mm] 950) bei [mm] p_w=0,9 [/mm] und n=1000 dürfte schon relativ hoch sein.

Und noch ein Tipp, stell die Frage höchstens auf teilweise beantwortet, sonst liest sie sich keiner mehr durch und wir könnten noch ein paar Meinungen gebrauchen ;-)

So, lass das mal sacken, ich geh schlafen und bin schon gespannt, was du dazu meinst.

L G walde

Bezug

Berechnung Wahrscheinlichkeit: Klärung und DANKE

Status:	(Frage) beantwortet
Datum:	10:00 Do 22.06.2006
Autor:	Martin_Messmer

Hoi Walde

Tausend Dank für Deine Mühe, die ich Dir mache :-)

Also:
Kann man sagen, wie ein Abstimmungesresultat verteilt ist? Ich gehe davon aus, dass bei einer Abstimmung die Verteilung einer Normalverteilung mindestens ähnlich ist (man sagt ja, dass ein Drittel meistens dafür, ein Drittel dagegen und ein Drittel unentschlossen ist). ich weiss aber nicht, ob man davon ausgehen kann, dass ein Abstimmungsresultat normalverteilt IST.

Konkret also:
Chormitglieder stimmen darüber ab, ob sie heute im Freien oder im Saal singen möchten. ALLE werden gefragt, aber ohne dass sie Antwort geben MÜSSEN. Es ergibt sich das Ergebnis von oben, also A gewinnt (dies sei: man singt im Saal und nicht im Freien).
Nun ist es doch so, dass gewisse Faktoren (Wetter, Jahreszeit (Pollenallergie :-)

) dabei eine Rolle spielen, wie abgestimmt wurde.

Nun ist meine Frage so:

Mit welcher Wahrscheinlichkeit würde A auch DANN gewählt, wenn HEUTE ALLE Chöre in derselben Stadt (also: gleiches Wetter, gleiche Jahreszeit) über dasselbe abstimen würden, egal, wie viele Chöre dies sind, egal, wie viele Sängerinnen und Sänger also. Dabei soll ausser acht gelassen werden, um was für Sorten von Chören es sich dabei handelt. Mich nimmt also die Signifikanz des Abstimmungsresultates Wunder. Ist dies nicht dasselbe, wie wenn ich frage: Mit welcher Wahrscheinlichkeit wurde A heute NICHT zufällig gewählt in meinem Chor?! Oder die Gegenwahrscheinlichkeit: Wie wahrscheinlich ist es, dass B und NICHT A gewählt würde, wenn ALLE Chöre der Stadt nach ihren Meinungen gefragt würden?!

Ist diese Fragestellung statistisch vielleicht gar nicht beantwortbar? Oder suche ich da nach verschiedenen Grössen?

Zudem: Mein Wissen ist auf etwa Maturebene (Abitur).

Die 'Stichprobe' ist 'mein Chor', die Grundgesamtheit wären dann 'alle Chöre der Stadt'.

Kann man nicht sagen, dass, wenn mit 87%iger Wahrscheinlichkeit Projekt A auch DANN gewählt worden wäre, wenn unendlich viele Leute darüber abgestimmt hätten (statt n Leute unendlich viele), dann auch mit 87% Sicherheit A NICHT zufällig gewählt wurde? Wenn dies zwei unterschiedliche Aussagen sind, dann meine ich eher erstere Aussage!

Nach einem Intervall fragen bei einer Abstimmung ... hmmm ... wie wäre denn für meine Frage das richtige Setzen der Intervallsgrenzen? "A erhält zwischen A [mm] \pm [/mm] ABS(A-B)/ Stimmen?

Herzlichen Dank für Dein Zeit-Geschenk!
Hoffentlich ist es für Dich auch ein wenig spannend...

L G
Martin

Bezug

Berechnung Wahrscheinlichkeit: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	16:07 Do 22.06.2006
Autor:	Walde

Hi martin,

jetzt habe ich den Eindruck, dass folgendes Modell angebracht wäre:

Jeder deiner Chorleute in der ganzen Stadt, hat seine Meinung. A, B oder C. Die schreibt er auf eine Kugel und legt sie in eine Urne. Dann werden aus der Urne zufällig n Kugeln gezogen und die Ergebnisse notiert. Was du bekommst ist eine Schätzung der Stimmverteilungen in deiner Grundgesamtheit, anhand von einer Stichprobe mit Umfang n. Deiner Grundgesamtheit liegt eine gewisse, feste Verteilung zu Grunde, (In diesem Fall nährungsweise Multinomialverteilt, einfacher wäre es, wenn man nur mal drinnen und draussen A und B zulassen würde), die du per Stichprobe zu schätzen versuchst. Je grösser dein n , desto besser wird diese Schätzung, würdst du alle Kugeln ziehen, wüsstest du das genaue Ergebnis. Es ist allerdings SEHR unwahrscheinlich, das deine Schätzung EXAKT die Verteilung "trifft". Das liegt daran, dass es unendlich viele Verteilungsmöglichkeiten gibt. Was man in der Praxis bei solchen Schätzung macht, ist ein Intervall anzugeben, dass mit einer gewissen Sicherheit, den wahren zu schätzenden Parameter überdeckt. Meist mit 95%iger Sicherheit. Ein solches Intervall nennt man

Konfidenzintervall. Vielleicht ist dir ja damit geholfen.

Ich muss jetzt weg, ich denk heut Abend nochmal weiter ;-)

Bis dann,

EDIT:

Wie man vielleicht auch rangehen kann:
Du fragst, ja: wird A wieder gewählt? D.h. gibt es mehr A-Stimmen, als B-Stimmen, Enthaltungen spielen keine Rolle in der Grundgesamtheit. Man kann das wieder als Hypothesentest formulieren, indem man eine Annahme fomuliert (z.B. Anzahl der A-Stimmen < Anzahl B-Stimmen) und diese dann entweder Ablehnen kann (mit einer gewissen Irrtumsw'keit, meist 5%) oder als wahr annimmt.

So hat man es in dem Beispiel mit den Aufgaben gemacht: Man hatte eine Hypothese (dass die Aufgabe gleichschwer sind). Dann schaut man welches Ergebnis man hat und wie Wahrscheinlich dieses Ergebnis ist unter der Annahme, dass die Aufgaben gleichschwer waren. Falls dieses oder ein noch extremeres Ergebnis eine W'keit von 5% oder weniger hat, wird die Annahme verworfen. Man glaubt dann, dass die Aufgaben wohl doch nicht gleichschwer waren.

Konfidenzbereiche und Hypothesentests hängen übrigrens eng zusammen: Man kann eine Hypothese, anhand einer gemachten Stichprobe, genau dann ablehnen, wenn die getestete Hypothese nicht mehr im, aus derselben Stichprobe ermittelten, Konfidenzbereich liegt.

L G walde

Bezug

Berechnung Wahrscheinlichkeit: Modell

Status:	(Mitteilung) Reaktion unnötig
Datum:	23:34 Do 22.06.2006
Autor:	Martin_Messmer

Lieber Walde

DANKE - ja, diese Deine Modelle sind plausibel, vor allem das mit den Kugeln, die als Stichproben aus der Grundgesamtheit gezogen werden.

Was sagst Du zu folgendem Modell, das Schraubenzustände mit den Wahlen vergleicht (kam mir soeben durch den Kopf):

Unzählige Schrauben werden hergestellt (das sind dann alle Chorsängerinnen und -sänger :-)

), von denen nicht bekannt ist, wie die Ausschussschrauben-Zahlen verteilt sind. Man weiss folgendes: es gibt drei verschiedene Arten von Schrauben:

1.:  die Schrauben sind perfekt  (das wären Stimmenthaltungen oder Stimmen, die BEIDE, A UND B wählten).
2.:  die Schrauben haben defekte Köpfe (das wären alle 'nur A'-Stimmen).
3.:  die Schrauben haben defekte Gewinde ('nur B'-Stimmen).

Nun macht man Stichproben des Umfanges n  (dies sind in meinem Beispiel 75). Dabei sind eine gewisse Anzahl Schrauben perfekt (in meinem Beispiel 57 an der Zahl). Einige haben defekte Köpfe (im Beispiel 12) und schliesslich haben einige Schrauben defekte Gewinde (im Beispiel 6).

Nun wäre die Frage, die mich interessiert:

Wie wahrscheinlich ist es, dass sich in der Grundgesamtheit (die unzähligen Schrauben) ebenfalls MEHR Schrauben mit defekten Köpfen als solche mit defektem Gewind befinden, so wie dies in der Stichprobe der Fall ist, egal, WIE viel Schrauben genau mehr defekte Köpfe als defekte Gewinde haben?!

Wie denkst Du über dieses Modell, und wie müsste ich da diese Wahrscheinlichkeit berechnen?

Dass Du Dir so viel Zeit nimmst, ist mir übrigens nicht selbstverstönlich!
DANKE!!

Ein lieber Gruss

Martin

Bezug

Berechnung Wahrscheinlichkeit: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	00:58 Fr 23.06.2006
Autor:	Walde

Ist gern geschehen.

Das Modell mit den Schrauben passt auch einwandfrei. Nur die Fragestellung macht mir immer noch Sorgen.

Die Frage darf nicht lauten: "Wie wahrscheinlich ist es, dass sich in der Grundgesamtheit MEHR Schrauben mit defekten Köpfen als solche mit defektem Gewind befinden".

Denn in der Grundgesamtheit GIBT es entweder mehr defekte Schrauben mit Köpfen oder NICHT (wenn man mal von gleichviel absieht). Das ist
keine Frage der Wahrscheinlichkeit. Es ist so oder es ist nicht so.

Die Frage muss lauten:
"Kann ich aufgrund der Stichprobe weiterhin davon ausgehen, dass es mehr Schrauben mit defekten Köpfen als Gewinde gibt oder kann ich das nicht?"
Alternativ, kann man aber auch umgekehrt nach mehr Schrauben mit defektem Gewinde fragen.

Das ist ein

Hypothesentest der einem mit einer gewissen

Irrtumswahrscheinlichkeit eine "Entscheidungshilfe" gibt.

Sei [mm] p_K: [/mm] Anzahl der Schrauben mit def. Kopf und
[mm] p_G:Anz. [/mm] d Schraub mit def. Gewinde

Dann kann man wie gesagt, aus der Stichprobe auch z.B den Paramter [mm] p_K-p_G [/mm] schätzen und sich (aufgrund der Stichprobe) ein (Konfidenz-)Intervall ausrechnen, das mit 95%iger Sicherheit den wahren Parameter der Grundgesamtheit enthält. In den 5% der Stichproben wo das nicht der Fall ist, war die Stichprobe so "verrückt", dass uns das einfach einen falschen Eindruck vermittelt hat.
Z.B in der Urne sind 100 Kugeln, 10 weisse, 90 Schwarze. Ich ziehe 10 raus und habe 9 weisse gezogen. Was würde ich denken? Dass es ca. 90% weisse Kugeln sind, mein Konfidenzbereich würde etwa so aussehen: Anteil weisser Kugeln [83%;97%] (Zahlen hab ich mir ausgedacht) Dass ich eine Stichprobe "erwischt" habe, die total unwahrscheinlich war, kann ich ja nicht wissen.

Etwas klarer geworden? Schätzen und Testen ist ein interessantes Gebiet, aber wie immer auf Anhieb nicht leicht zu durchschauen.

L G walde

Bezug

Berechnung Wahrscheinlichkeit: Danke!

Status:	(Mitteilung) Reaktion unnötig
Datum:	02:56 Fr 23.06.2006
Autor:	Martin_Messmer

Lieber Walde

Nun habe ich glaub endlich etwas begriffen:
Mit einem 95%-Test sage ich aus, sollte dieser als 'bestanden' über die Bühne gegangen sein, dass die Grundgesamtheit nur DANN anders aussehen würde (der Chor also eigenartig (oder einzigartig, aussergewöhnlich) abgestimmt hätte), wenn ich gerade die ungünstigen 5% aller möglichen Stichproben 'erwischt' hätte... Also bei 1 von 20 Proben wäre mein Entscheid dann trotz aller Mathematik nicht so gut gewesen :-)

- [ und bin ich ein geborener Pechvogel, dann sind es auch mal 3 von 20 Proben, weil ich häufiger als andere in die 5 üblen Prozente greife :-)

]

Wieder ernst:
Bei Noten eines Schülers kann ich diesen Test nun durchführen und berechnen, welches Notenskalen-Intervall etwa wie viele Noten enthält.

Dabei hätte ich so gerne gewusst, wie 'eindeutig' ein Abstimmungsresultat ist :-)

Nun muss ich aber gestehen, dass ich recht ahnungslos bin, ob ich nun eine nützliche Grösse aus meinem Beispiel errechnen kann, die etwas über die Aussagekraft des Abstimmungsresultates aussagt.

Sollte es Dir noch nicht verleidet sein - ich wäre nun froh um ein konkretes Rechnungs-Beispiel, wie ich das Abstimmungsresultat (mein Beispiel oben) statistisch beurteilen, seine Aussagekraft abwägen kann.
Ich denke eben auch, dass ein Abstimmungsresultat SEHR eindeutig sein muss, um nicht durch den Hypotesen-Test durchzufallen, der auf 95% angesetzt ist - oder was denkst Du, liege ich da falsch? Oder ist meine Aufgabenstellung generell etwas müssig?

Ein ganz gelungner Tag für Dich und - DANKE!!

LG!
Martin

Bezug

Berechnung Wahrscheinlichkeit: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	16:47 Fr 23.06.2006
Autor:	Walde

Hi Martin,

freut mich, dass ich dir helfen konnte. Ok, also jetzt mal rechnen:

Wir testen also die Hypothese, dass A und B einen gleich hohen Anteil in der Grundgesamtheit haben. Dabei spielen die Leute, die sich nicht entscheiden konnten für unsere Hypothese keine Rolle.Wir tun also so, als ob sie gar nicht vorhanden wären und nehmen diese (in unserem Modell) aus der Urne heraus bzw. tun so, als ob wir nur A oder B Kugeln gezogen hätten. Das erleichtert uns die Rechnung folgendermassen. Wir gehen nunmer bei 12 A und 6 B Stimmen von einem Stichprobenumfang von 18 aus. Wenn also [mm] p_A [/mm] der Anteilswert der A-Stimmen und [mm] p_B [/mm] der Anteilwert der B-Stimmen ist und der gleich ist, dann gilt [mm] p_A=p_B=0,5. [/mm] Und wir müssen nur die Hypothese

[mm] H_0:p_A=0,5 [/mm] gegen die Alternative [mm] H_1:p_A\not=0,5 [/mm] testen.

Dabei ist die Zufallsvariable X=Anzahl der gezogenen A-Kugeln binomialverteilt mit n=18 und (unter [mm] H_0) p_A=0,5. [/mm]

Wir lehnen die Hypothese ab, falls X zu klein oder zu gross ist. Dabei soll die Wahrscheinlichkeit für eine Ablehnung von [mm] H_0, [/mm] obwohl [mm] H_0 [/mm] zutrifft (Irrtumswahrscheinlichkeit, auch Fehler 1.Art oder [mm] \alpha-Fehler [/mm] genannt), kleiner oder gleich 5% sein. Wir lehnen ab, falls [mm] X\in\{0\ldots u\}\cup\{o\ldots 18\}. [/mm] u und o sind untere bzw. obere Schranken und sind, da die Verteilung von X unter [mm] H_0 [/mm] symmetrisch ist, auch symmetrisch um den Erwartungswert (9) verteilt. Man muss nun u und o so bestimmen, dass [mm] P(X\le u)+P(X\ge o)\le [/mm] 0,05

Ich nehme natürlich einen Wahrscheinlichkeitsrechner, in der Schule kuckt man in einer Tabelle nach und erhalte:

[mm] P(X\le4)+P(X\ge [/mm] 14)=0,0309

Wir können die 5% nicht ganz ausnutzen, weil X diskret veteilt ist. Würden wir den Bereich noch vergrössern (müssten wir ja symmetrisch auf beiden Seiten machen) würden wir die 5% überschreiten (bei u=5/o=13 käme man auf 0,097.)
Unser Ablehnungsbereich ist also [mm] \{0\ldots 4\}\cup\{14\ldots 18\} [/mm]

Das heisst für unseren Test, wir können ihn nicht ablehnen. Wir müssen also weiterhin davon ausgehen, dass die Anteilswerte gleich sind.
Das heisst aber NICHT, dass wir einen "Beweis" dafür haben. Es spricht nur nichts extrem dagegen.
Etwas sehr Aussagekräftiges hat man NUR bei einer Ablehnung, denn dann irrt man sich wirklich nur in 5% (oder weniger, bei uns ca. 3%) der Fälle,d.h. es spricht viel GEGEN die Hypothese. In unserem Fall spricht nichts dagegen, aber das heisst NICHT, dass viel DAFÜR spricht. Das ist ein sehr wichtiger Aspekt bei Hypothesentests.

Selbst wenn die Stimmen in Wirklichkeit 2:1 verteilt wären, also 2/3 für A und 1/3 für B (also 2/3 Mehrheit!), hätte unser Test, das nur mit einer W'keit von

[mm] 1-P(5\le X\le [/mm] 13)=1-0.7688=0,2312=23%

erkannt. Das nennt man die Güte eines Tests. Das Problem ist der geringe Stichprobenumfang. Hätten wir insgesamt 180 Leute, die für A oder B abgestimmt haben (also n=180), hätten wir einen Ablehnungsbereich von

[mm] \{0\ldots 76\}\cup\{104\ldots 180\} [/mm] und falls dann 120 Leute für A gestimmt hätten (selbes Verhältnis wie vorher), könnten wir die Hypothese ablehnen und würden uns damit nur in (weniger als) 5% der Fälle irren, könnten also ziemlich sicher sein.

Dieser Test würde ein wahres [mm] p_A=2/3 [/mm] in über 99% der Fälle "entdecken"und falls [mm] p_A=0,6 [/mm] immer noch in über 75% der Fälle.
Eine Stimmenmehrheit von 55% aber auch nur noch mit ca. 25% W'keit

Die ganze Sache steht und fällt mit dem Stichprobenumfang. Je geringere Abweichungen von der Hypothese man erkennen können will, ohne dabei den Fehler 1.Art zu vergrössern, desto grösser muss der Stichprobenumfang sein.

Man kann sich auch eine Güte vorgeben und dann nach n auflösen, man nennt das Fallzahlplanung. Dann weiss man, wieviele Personen man befragen muss, um einen aussagekräftigen Test zu bekommen, das ist mir jetzt im Moment aber zu viel Arbeit ;-)

Ok, noch Fragen? ;-)

Kannst auch ruhig mal, wenns dich interessiert, in der Wikipedia nach den Fachbegriffen suchen, da ist einiges erläutert (glaub ich).

Schönes Wochenende,

L G walde

Bezug

Berechnung Wahrscheinlichkeit: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	22:36 Fr 23.06.2006
Autor:	Martin_Messmer

Lieber Walde

Mega grossen Dank für Deine Hilfe! Ich habe alles verstanden, denn Du hast mir total ausführlich den Lösungsweg geschenkt.

Was ich ja lustig finde, ist folgendes:

Dass meine Formel (Abs(A - 1)-1)/ [mm] \wurzel{A + B} [/mm] = z, woraus dann 'mein' F(z) zu berechnen ist( F(z) = $ [mm] \integral_{-unendlich}^{z}{1/ \wurzel{2\cdot{} \pi}\cdot{} e^{- t^{2}/2} dt} [/mm] $ ), genau folgendes liefert:

dass bei A=4 und B=14 eine Irrtumswahrscheinlichkeit von 3.3%, und bei A=76 und B=104 eine Irrtumswahrscheinlichkeit von 4.41% geliefert wird, hingegen bei A=5 und B=13 ca. 9.9% und bei A=103 und B=77 ca. 6.24%, mit anderen Worten, dass mein einfacher Test zum selben Resultat kommt wie Dein Lösungsweg. :-)

Trotzdem, Deine Hilfe ist mega, und ich möchte gern nach Deinem Weg vorgehen und darum nur noch eines wissen (fand es nicht in Wipikedia):

$ [mm] P(X\le4)+P(X\ge [/mm] $ 14)=0,0309

Wie lässt sich dieses 3.09% aus den Ober- und Untergrenzen berechnen? welcher Formel liegt dies zugrunde? Oder kennst Du im Programm Excel eine dazu nötige Formel, die ich einsetzen könnte?

Schliesslich:
Hättest Du Freude an meiner Exceldatei, die Abstimmungsergebnisse ein wenig auswertet und grafisch darstellt?

Ist mega lieb von Dir, Deine Riesenhilfe!

Hab ein ganz gutes Wochenende!!

Herzlich

Martin

Bezug

Berechnung Wahrscheinlichkeit: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	07:08 Sa 24.06.2006
Autor:	Walde

Hi Martin,

das ist doch ganz einfach ;-)

X ist (wenn [mm] H_0 [/mm] gilt, wovon wir ausgehen)

binomialverteilt<-(nachlesen), mit n=18 und p=0,5

[mm] P(X\le 4)=P(X=0)+P(X=1)+\ldots+P(X=4)=\vektor{18 \\ 0}0,5^{18}+\vektor{18 \\ 1}0,5^{18}+\ldots+\vektor{18 \\ 4}0,5^{18}, [/mm] da wird(sollte)0,01545 rauskommen, die Hälfte von 0,0309

[mm] P(X\ge 14)=1-P(X\le 13)=1-(P(X=0)+\ldots+P(X=13)) [/mm] =die andere Hälfte

usw.

Dass bei dir und bei mir ähnliche Ergebnisse rauskommnen, liegt wohl daran, dass man die Binomialverteilung durch die Normalverteilung approximieren kann. Aber eigentlich ist der Stichprobenumfang dafür zu klein. Vielleicht ist deine Teststatistik besser. Wobei ich nicht verstehe, warum. Aber ich komm grad von der Party und hab mordsmässig einen sitzen,also mach ich mir nicht so viel Gedanken ;-)

Hauptasche du hast vestanden, was abgeht. ;-)

Übrigens bei Excel kann ich dir nicht helfen, also machs gut und auch für dich ein schönes Wochenende.

L G walde

Bezug

Berechnung Wahrscheinlichkeit: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	15:29 Sa 24.06.2006
Autor:	Martin_Messmer

Danke, lieber Walde

Nun hast Du hier Deine Hilfe wohl abgeschlossen, denn ich komme nun draus :-)

. DANKE!!! DANKE!!!

Noch zu bemerken:
Die Binomialformel ergibt bei einem Abstimmungsresultat, bei welchen beliebig viele Stimmende BEIDE bzw. KEINES wählten, dann einige 'nurA', eine Irrtumswahrscheinlichkeit = 0% an :-)

. Meine Formel hingegen (Normalverteilt) gibt noch einen Wert an. Irrtum ist doch IMMER möglich :-)

.

Also - nochmals ganz herzlichen Dank für alles!! Und solltest Du mein Programm haben wollen, dann melde Dich doch einfach nochmals hier!

Alles Gute Dir!

Martin

Bezug

Ansicht:

[ geschachtelt ]

Forum "Uni-Stochastik" |

Alle Foren |

Forenbaum | Materialien