Hallo,
ich beschäftige mich gerade für eine Prüfung mit der multiplen linearen Regression und zwar habe ich dabei als Literatur Christof Wolf und Henning Best: "Handbuch der sozialwissenschaftlichen Datenanalyse". Ich schreibe mal auf, welche Buchstaben die in der Regressionsgleichung verwenden, damit wir über das gleiche reden:
y (Dach) = Beta0 + Beta1 x1 + Beta2 X2 + ..... + Betak Xk
Y (Dach) ist dabei Y minus den Fehlerterm, Beta 0 ist der Punkt, wo die Regressionsgerade die Y-Achse schneidet. Die anderen Betas sind die Steigungskoeffizienten.
Das zentrale Problem der Regressionsanalyse ist es ja, die Schätzer für die Regressionskoeffezienten so zu bestimmen, dass die vom Modell geschätzten y-Werte den beobachteten y-Werten möglichst gut entsprechen.
Deswegen versucht man ja die Summe der quadrierten Residuen zu minimieren.
Ich habe nun früher geglaubt, dass man sie aus dem Grund quadrieren würde, weil wenn zum Beispiel ein beobachteter Y-Wert um drei Einheiten nach oben von der Regressionsgerade abweichen würde und ein anderer beobachteter Y-Wert um drei Einheiten nach unten abweichen würde, die Summe davon Null wäre.
In meinem Buch steht aber nun etwas Anderes (und das verstehe ich nicht): "Daher erscheint es zunächst naheliegend, die Regressionskoeffizienten so zu bestimmen, dass die, über alle Beobachtungseinheiten aufsummierten Residuen, als die Summe von Epsilon (Epsilon ist der Fehlerterm), minimiert werden. Dieser Ansatz führt jedoch nicht zum gewünschten Ergebnis, da beliebig viele Mengen Betaj existieren, bei denen die Summe der Residuen gleich Null ist. Dies ist für alle diejenigen Mengen Betaj der Fall, bei denen die vorhergesagten Werte durch den Schwerpunkt der Verteilung, also durch den Punkt (Y quer, x1 quer, x2 quer, ...., xk quer) gehen."
Mal ganz dumm gefragt: Warum ist hier von Mengen Betaj die Rede? Und warum ist die Rede davon, dass sie durch den Schwerpunkt der Verteilung (x1 quer, x2 quer, ...., xk quer) gehen (Y quer verstehe ich).
Kann mir das jemand erklären? Vielen Dank im Voraus.