Signifikanz testen < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) überfällig | Datum: | 01:03 Mi 24.02.2016 | Autor: | nero08 |
Hallo!
Ich abreite gerade an meiner Diplomarbeit und möchte meine gefundenen Resultate statistisch belegen. Ich habe rausgefunden, dass es dazu einen sogenannten t-test benötigt. Nur weiß ich jetzt nicht, welchen ich verwenden soll bzw. verwenden darf.
Grundsätzlich würde habe ich herausgefundne, dass es einen ungepaarten t-test, einen gepaarten t-test, sowie den welch test gibt die für mich wohl in Frage kommen.
Meine Situation. Ich habe drei Messergebnisse. Die Gruppe ist jeweils die gleiche bzw. besteht aus den gleichen Personen, wobei ich vereinfacht gesagt, bei der 1.Messung ein n=20 habe, bei der 2.Messung ein n=12 und bei der 3.Messung ein n=20
Den ungepaarten T-test darf ich ja nicht verwenden, da die Gruppe ja die gleiche ist oder? Gleiches gilt für den welch Test (auch die Varianz würde sich nicht so stark unterscheiden, dass dieser verwendet werden kann).
Beim gepaarten T-Test könnte ich die 1. Messung und die 3.Messung vergleichen, aber was mach ich mit der 2.Messung, dass n muss ja gleich sein oder?
Auch hab ich generell ein Problem mit der Normalverteilung, da es generell nur bei den Ergebnissen darum ging, das Antworten entweder falsch oder Richtig sind und es dazwischen nichts gibt.
Welche Testung kann ich jetzt hier verwenden bzw. wie ist vorzugehen?
Für meine Berechnungen würde ich dies hier verwenden: http://graphpad.com/quickcalcs/ttest1/?Format=50
diese seite würde btw. beim gepaarten T-test auch ein ungeliches n schlucken....
danke und lg
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 10:10 Mi 24.02.2016 | Autor: | huddel |
Hallo nero08,
ich habe das Gefühl, du vermischst hier ein paar Dinge die so nicht passen können. Deshalb fangen wir ganz vorne an.
Zuerst: Wenn du eine Statistische Analyse machen möchtest überlegst du dir vor der eigentlichen Erhebung, was für einen Test du machen möchtest und baust darauf dein Experiment auf. Da das in der Realität die wenigsten machen sehe ich darüber aber mal hinweg.
Nun zu deiner Situation: Ich würde gern erstmal klären wie diese genau aussieht, daher trage ich mal die Informationen zusammen, die du gegeben hast und interpretiere noch ein paar dazu und du sagst mir, ob das so stimmt.
Es gab 3 Testzeitpunkte
Testung 1.:
du hattest eine Gruppe von 20 Personen (n=20)
Du hast einen Fragebogen (elektronisch, Papier oder Gespräch) vorgelegt.
Die möglichen Antworten konnten entweder richtig oder Falsch sein
Testung 2:
du hattest die gleiche Gruppe nur diesmal 12 Personen (n=12)
Du hast einen Fragebogen (elektronisch, Papier oder Gespräch) vorgelegt.
Die möglichen Antworten konnten entweder richtig oder Falsch sein
Testung 3:
du hattest die gleiche Gruppe, diesmal wieder 20 Personen (n=20)
Du hast einen Fragebogen (elektronisch, Papier oder Gespräch) vorgelegt.
Die möglichen Antworten konnten entweder richtig oder Falsch sein
Hier tauchen nun ein paar Fragen auf:
1.) Ist der Fragebogen bei jeder Testung der gleiche?
2.) Was erheben diese Fragebögen?
3.) Die wohl wichtigste Frage: was möchtest du untersuchen?
Ich interpretiere mal weiter:
Es sind 3 verschiedene Fragebögen, du möchtest die Leistung in dem jeweiligen Fragebogen angucken und ob es signifikante Unterschiede in ihnen gibt.
Wahrscheinlich liege ich völlig falsch. In jedem Fall erzähl mir doch etwas über den Versuchsaufbau.
Noch eins: t-Test wird für deine Zecke völlig ungeeignet sein, da dies ein Test für stetige Verteilungen ist und du im diskreten Fall bist. Und vom Welch-Test würde ich auch die Finger lassen, wenn du keinen guten Grund hast, diesen an zu wenden.
Viele Grüße,
Huddel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 10:47 Mi 24.02.2016 | Autor: | nero08 |
Hallo!
Danke mal für die Antwort!
Das kann gut sein, hab mich wohl in was falschem verrannt.
Du siehst das schon ganz richtig, lass mich aber etwas konkreter werden:
Strenggenommen vergleiche ich nicht ganze Testungen miteinander sondern einzelne Fragen jener.
zu 1.) Also ich nehme eine Frage von Testung 1(an jener 20 Personen teilgenommen haben) und vergleiche sie mit einer ähnliche Frage von Testung 2(an der 12 Personen teilgenommen haben). Du liest vl. bereits heraus, dass Testung 1 und Testung 2 nicht exakt gleich waren. Jedoch war die 3. Testung die gleiche wie Testung 1. Also gilt, dass Anfangstestung = Abschlusstestung, jedoch war die Zwischentetung eine andere.
zu 3.)Diese Fragen die ich untersuchen möchte können nun richtig oder falschg sein. Sagen wir nun die 1.Frage die ich untersuchen möchte, wurde bei testung 1 von 5% korrekt, bei Testung 2 von 40% korrekt und bei testung 3 von 70% korrekt beantwortet. Ich möchte nun wissen, war der Anstieg von 1 auf 2 signifikant, war der Antstieg von 2 auf 3 signifikant und war der Anstieg von 1 auf 3 signifikant.
zu 2.) Die Fragen prüfen grundsätzlich wissen ab. Also Wissen welches Studenten über ein Thema zu Beginn der Untersuchung haben, wie sich das Wissen im Laufe der Vermittlung entwickelt(Zwischentestung) und wie es am Ende aussieht (Abschlusstestung).
Weiters: Die getesteten Personen waren die gleichen (bei der 2. Testung war es halt eien teilmenge). Wichtig ist jedoch, dass die Testungen anonym waren, was bedeutet, dass ich nicht zuordnen kann, wer welche Antowrt gegeben hat.
Grundsätzlich liegts du also mit deinen interpretationen ganz gut ;)
danke und lg
EDIT: Ich werde langsam das Gefühl nicht los, dass für mich gar kein Test passen wird, da meien Stichproben verbunden sind und anonym.
> Hallo nero08,
>
> ich habe das Gefühl, du vermischst hier ein paar Dinge die
> so nicht passen können. Deshalb fangen wir ganz vorne an.
>
> Zuerst: Wenn du eine Statistische Analyse machen möchtest
> überlegst du dir vor der eigentlichen Erhebung, was für
> einen Test du machen möchtest und baust darauf dein
> Experiment auf. Da das in der Realität die wenigsten
> machen sehe ich darüber aber mal hinweg.
>
> Nun zu deiner Situation: Ich würde gern erstmal klären
> wie diese genau aussieht, daher trage ich mal die
> Informationen zusammen, die du gegeben hast und
> interpretiere noch ein paar dazu und du sagst mir, ob das
> so stimmt.
>
> Es gab 3 Testzeitpunkte
>
> Testung 1.:
> du hattest eine Gruppe von 20 Personen (n=20)
> Du hast einen Fragebogen (elektronisch, Papier oder
> Gespräch) vorgelegt.
> Die möglichen Antworten konnten entweder richtig oder
> Falsch sein
>
> Testung 2:
> du hattest die gleiche Gruppe nur diesmal 12 Personen
> (n=12)
> Du hast einen Fragebogen (elektronisch, Papier oder
> Gespräch) vorgelegt.
> Die möglichen Antworten konnten entweder richtig oder
> Falsch sein
>
>
> Testung 3:
> du hattest die gleiche Gruppe, diesmal wieder 20 Personen
> (n=20)
> Du hast einen Fragebogen (elektronisch, Papier oder
> Gespräch) vorgelegt.
> Die möglichen Antworten konnten entweder richtig oder
> Falsch sein
>
> Hier tauchen nun ein paar Fragen auf:
>
> 1.) Ist der Fragebogen bei jeder Testung der gleiche?
> 2.) Was erheben diese Fragebögen?
> 3.) Die wohl wichtigste Frage: was möchtest du
> untersuchen?
>
> Ich interpretiere mal weiter:
> Es sind 3 verschiedene Fragebögen, du möchtest die
> Leistung in dem jeweiligen Fragebogen angucken und ob es
> signifikante Unterschiede in ihnen gibt.
>
> Wahrscheinlich liege ich völlig falsch. In jedem Fall
> erzähl mir doch etwas über den Versuchsaufbau.
>
> Noch eins: t-Test wird für deine Zecke völlig ungeeignet
> sein, da dies ein Test für stetige Verteilungen ist und du
> im diskreten Fall bist. Und vom Welch-Test würde ich auch
> die Finger lassen, wenn du keinen guten Grund hast, diesen
> an zu wenden.
>
> Viele Grüße,
>
> Huddel
>
>
>
>
>
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:58 Mi 24.02.2016 | Autor: | nero08 |
Ist korrekt. Es geht darum zu messen wie positiv/negativ sich der Unterrich bzw. das umgesetzte Konzept auswirkt.
Die Proben sind abhängig, dass ist korrekt. Nur kann ich eine Zuordnung bzw. Paare wie sie beispielsweise der McNemar-Test vorsieht nicht machen, da meine Ergebnisse anonym sind, ich also nicht weiß, wer die Frage wie beantwortet hat.
Ich habe unterschiedliches im Internet gefunden. Eine Quelle sagt in diesem Fall kann man keine Testung vornehmen, eine andere sagt, dass es sich dann um einen unabhängigen Test handelt.
Was meint ihr dazu?
> Es wird noch immer nicht wirklich klar, was deine
> Forschungsfrage ist.
> Möchtest du untersuchen, wie der Unterricht das Lernen
> eines bestimmten Themenbereichs beeinflusst?
> Weitere Interpretationen deines Vorhabens sind möglich.
>
> Du solltest "The good research guide" von Martyn Denscombe
> zu Rate ziehen. Eine Probandenzahl von 20 Personen ist
> grenzwertig gering.
> Bei nicht-intervallskalierten und nicht-normalverteilten
> Variablen nutzt man
> nicht-parametrische Tests.
> Deine Stichproben sind abhängig, da mehrere Stichproben an
> einer Versuchspersonengruppe durchgeführt wurden. Für
> ordinalskalierte Variablen ist der
> Wilcoxon Paarvergleichstest
> das Mittel der Wahl. Man findet
> hier
> eine Begründung der Auswahl.
> Allerdings ist z.B. 0 = falsch, 1 = richtig, eine
> dichotome Nominalskalierung, was wahrscheinlich auf deine
> Studie zutrifft, wenn ich deine Beschreibung richtig
> verstanden habe.
> Du solltest dir daher folgende
> Tabelle
> ansehen. Hier werden statistische Tests nominalskalierten
> Daten zugeordnet.
>
> Bsp. aus der Tabelle:
> Test auf Signifikanz von Unterschieden -> nominalskaliert
> -> abhängige Stichprobe [mm]\Rightarrow[/mm] McNemar-Test oder
> Vorzeichen -Test.
>
> Viele Grüße
> Ladon
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 11:26 Do 25.02.2016 | Autor: | nero08 |
keiner ne idee? :(
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:14 Fr 26.02.2016 | Autor: | huddel |
Sorry für die späte Antwort:
also streng genommen funktionieren hier garkeine tests mehr, da dir die Verbindung zwischen den Erhebungen fehlt (da "anonym") die Stichproben aber auch nicht unabhängig sind, daher Unabhängige Tests auch nicht wirklich aussagekräftig wären.
Meine Idee wäre noch gewesen für die erste Erhebung deine Verteilung zu schätzen und mit einem Binomialtest die Abweichung von der ersten zur zweiten Erhebung nach zu untersuchen. Das wäre aber alles andere als sauber...
Aus meiner Sicht gibt es nun zwei Dinge, die du machen kannst:
1.: Deskriptive & explorative Statistik. Sprich die Messzeitpunkte einzeln betrachten, gucken wie dort die Einzelnen Verteilungen aussehen und ein paar Bildchen malen. Vllt kannst du sogar Annahmen über Trends treffen.
2.: Nochmal neu testen, dir aber dieses das von Ladon genannte Buch (oder irgend ein Ähnliches) zu Gemüte führen.
Versteh mich nicht falsch, das ist kein Vorwurf, derartige Problematiken begegnen mir andauernd und du bist da bei weitem nicht der einzige. Eine saubere Versuchs- und Auswertungsplanung ist nun mal leider einer der zentralen Punkte bei Wissenschaftlichen Studien.
Tut mir leid, dass wir dir nicht wirklich weiter helfen konnten. Vllt schaut hier ja noch jemand anders rein, der dann eine zündende Idee hat...
LG
Huddel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:30 Fr 26.02.2016 | Autor: | nero08 |
Kein Problem, du hilfst ja freiwillig ;)
hm, schwer. ich hätte jetzt schon quellen gefunden, die sagen, dass wenn man keine Paare bilden kann, man auf einen unabhängigen Test zurückgreifen soll.
schau dir mal folgenden link an: http://de.slideshare.net/theCMEguy/statistical-analysis-for-educational-outcomes-measurement-in-cme
folie 12ff. ist wenn du mich fragst genau mein Problem. ich denkge generell, dass die vorgehensweise recht unklar ist in dem Fall. Im Rahmen meienr Recherchen hab ich so und so gemerkt, dass im Rahmen der Statistik es so und so viel unterschiedliche Meinungen gibt. Alleien was für unterschiedliche zahlen ich jeweils bzg. samples gelesen hab is a skandal....
auch hab ich ja wenn du schaust, zwischen der zwischentestung und der anfangs und abschlusstestung eine diskrepanz bei der anzahl der zu testenden personen. auch dies würde für eien unabhängige testung sprechen. für eine abhängige müssen es ja exakt die gleichen Leute sein oder? Auch bestand meien Versuchsgruppe grundsätzlich aus 20 Leuten, jedoch fehlte jweils einer bei der Anfangs und Abschlusstestung, ergo war ja auch das ganz streng genommen net die gleiche Gruppe oder?
Also ich hätte mich jetzt entschieden, dass ich den Fischer Exakt test verwende( da ich ja recht kleien samples habe). Was haltest du davon?
Das mit dem Binomialtest möchte ich lieber lassen, da fehlts mir einfach an wissen...
zu 1.) du meinst jetzt einfach, prozentuell auswerten und so oder? das hätte ich so und so gemacht bzw. habs gemacht. ich wollte des halt mit signifikanz untermauern....
zu 2.) das ist auf keienn fall möglich. meien arbet ist fertig und ich möchte sie abgeben. das einzige was fehlt ist das was wir hier bereden.
Ich muss schon zugeben, dass ich nie wirklich an eine statistische auswertung gedacht habe, dies kam erst am ende der testung auf. ich hätte mich mit 1.) begnügt....
danke dir jedenfalls, wennst noch kurz auf die fragen eingehst wäre dies fein....
> Sorry für die späte Antwort:
>
> also streng genommen funktionieren hier garkeine tests
> mehr, da dir die Verbindung zwischen den Erhebungen fehlt
> (da "anonym") die Stichproben aber auch nicht unabhängig
> sind, daher Unabhängige Tests auch nicht wirklich
> aussagekräftig wären.
> Meine Idee wäre noch gewesen für die erste Erhebung
> deine Verteilung zu schätzen und mit einem Binomialtest
> die Abweichung von der ersten zur zweiten Erhebung nach zu
> untersuchen. Das wäre aber alles andere als sauber...
>
> Aus meiner Sicht gibt es nun zwei Dinge, die du machen
> kannst:
>
> 1.: Deskriptive & explorative Statistik. Sprich die
> Messzeitpunkte einzeln betrachten, gucken wie dort die
> Einzelnen Verteilungen aussehen und ein paar Bildchen
> malen. Vllt kannst du sogar Annahmen über Trends treffen.
>
> 2.: Nochmal neu testen, dir aber dieses das von Ladon
> genannte Buch (oder irgend ein Ähnliches) zu Gemüte
> führen.
>
> Versteh mich nicht falsch, das ist kein Vorwurf, derartige
> Problematiken begegnen mir andauernd und du bist da bei
> weitem nicht der einzige. Eine saubere Versuchs- und
> Auswertungsplanung ist nun mal leider einer der zentralen
> Punkte bei Wissenschaftlichen Studien.
>
> Tut mir leid, dass wir dir nicht wirklich weiter helfen
> konnten. Vllt schaut hier ja noch jemand anders rein, der
> dann eine zündende Idee hat...
>
> LG
> Huddel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:20 Sa 27.02.2016 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|