Ich sitze gerade an meiner Masterarbeit und versuche, den Zusammenhang zwischen zwei Variablen zu modellieren. Die Streudiagramme sehen vielversprechend aus, aber wenn ich die lineare Regression laufen lasse, macht mich das R-Quadrat stutzig. Es ist einfach so niedrig, obwohl ich das Gefühl habe, dass da eine klare Tendenz im Plot ist. Ich frage mich, ob ich vielleicht einen grundlegenden Denkfehler bei der Interpretation habe oder ob das Modell einfach nicht passt.
Das trifft mich wenn der Plot eine klare Tendenz zeigt und das R Quadrat nichts davon widerspiegelt. Frust pur aber auch Neugier. Vielleicht steckt mehr in den Daten als eine gerade Linie vermuten lässt und das R Quadrat sagt nur wie gut linear vorhersagt wird
Vielleicht passt das lineare Modell wirklich nicht zur Form der Beziehung. Ein Scatterplot kann eine Linie zeigen doch die Residuen könnten Muster verraten. Prüfe Transformationen oder eine nicht lineare Form wie Polynom oder Logarithmus doch in der Regression könnte das Muster besser eingefangen werden
Vielleicht interpretierst du den Plot als Kausalität statt als Korrelation. Die klare Tendenz könnte Zufall sein oder von Störgrößen abhängen. Es muss nicht bedeuten dass die Beziehung so ist wie es aussieht
Ich frage mich ob R Quadrat überhaupt das richtige Maß ist hier. Vielleicht geht es mehr um Vorhersagegenauigkeit für bestimmte Bereiche als um Gesamtqualität der Fit
Vielleicht lohnt es sich den Kontext zu wechseln und die Fragestellung auf eine breitere Idee zu legen statt eine harte Linearität zu suchen. Zum Beispiel Betrachtung von Monotonie oder Trend in Subgruppen
Vielleicht führt eine einfache Transformation der Variablen zu einer besseren Passung doch das könnte zu ein neues Konzept führen das noch nicht erklärt ist