Multiple Lineare Regression < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Aufgabe | Erarbeiten Sie ein Multi-Lineares-Regressionsmodell.
Gegeben sind 61 Datenpunkte mit 27 möglichen Variablen. |
Hallo und danke schon mal im Voraus.
Ich bin der Statistik leider (noch) fern, deswegen weiß ich nicht ob die Frage wirklich hier her gehört!?
Also, es handelt sich um Bodenproben und ich konnte aus den gegeben Daten 27 mögliche Variablen ausmachen und die Stichprobe beträgt 61 Proben.
Da es von der statistischen Seite her nicht so exakt sein muss, habe ich mir eine Vorwärts-Regression überlegt und als Greedy-Algorithmus umgesetzt.
Ich bestimme für alle Variablen ein Modell und wähle dann anhand des F-Werts das beste Modell. Dann bestimme ich zum, bis jetzt besten, Modell die Variable, die den F-Wert am meisten erhöht usw..
Meine Abbruchkriterien sind eine Variablenzahl von fünf oder der F-Wert lässt sich nicht mehr erhöhen.
Das funktioniert soweit auch ganz gut, nur meint mein Programm es würde eine Variable reichen. Das deckt sich leider nicht mit dem Thema meiner Hausarbeit.
Auch gibt es eine vergleichbare Arbeit, die auf zwei Variablen kommt.
Aber zumindest stimmt die von mir gefundene Variable mit einer dieser Variablen überein.
Ich habe noch überlegt, gleichzeitig zu versuchen, den p-Wert zu minimieren oder zumindest tief zu halten, aber da scheitere ich an "R".
Also mein Problem ist, das mein Ergebnis von dem erwartet Ergebnis abweicht und ich deswegen fragen wollte ob ich diesen Greedy überhaupt so umsetzen kann?
Mit freundlichen Grüßen
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:20 Do 09.05.2013 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|