So interpretieren Sie die Ergebnisse von OLS

Blog

Egal, ob Sie neu in der Datenwissenschaft oder sogar ein erfahrener Veteran sind, die Interpretation der Ergebnisse eines maschinellen Lernalgorithmus kann eine Herausforderung sein. Die Herausforderung besteht darin, die Ergebnisse dieses Modells zu verstehen. Bedeutet dieses Ergebnis, wie gut das Modell mit den Daten funktioniert hat, mit denen Sie es trainiert haben? Die lineare Regression ist eine der am häufigsten verwendeten Methoden für Inferenz und Vorhersage. Aber oft neigen Menschen dazu, OLS-Annahmen zu ignorieren, bevor sie die Ergebnisse interpretieren. Daher ist dies ein wichtiger Schritt für die Analyse verschiedener von OLS veröffentlichter Statistiken. Ich werde den Datensatz zur Vorhersage des Hauspreises untersuchen, einen kleinen, einfachen Datensatz, der Beobachtungen verschiedener Eigenschaften und Preise von Häusern enthält.



Bild für Beitrag

Abhängig (vorhergesagt) variabler Preis



Unabhängige Variable - Größe

y = data['price'] x1 = data['size'] x = sm.add_constant(x1) results = sm.OLS(y,x).fit() results.summary()

Bild für Beitrag



Erster Teil (Modellzusammenfassung) Interpretation

Abt. Variable: Hier ist die abhängige Variable der Preis, den wir durch das Modell vorhersagen werden.

Anzeigeblock vs. Inline

Modell: OLS steht für Ordinary Least Squares. Gewöhnliche kleinste Quadrate ( OLS ) ist eine Art lineare Methode der kleinsten Quadrate zum Schätzen der unbekannten Parameter in einem linearen Regressionsmodell. OLS wählt die Parameter einer linearen Funktion einer Menge erklärender Variablen nach dem Prinzip der kleinsten Quadrate aus.

Methode: Kleinste Quadrate ist ein Standardansatz in der Regressionsanalyse, um die Lösung durch Minimieren der Summe der Quadrate der Residuen anzunähern.

Anzahl der Beobachtungen: Gesamtzahl der im Datensatz vorhandenen Beobachtungen

Df-Rückstände: df(Residual) ist die Stichprobengröße abzüglich der Anzahl der geschätzten Parameter, also wird df(Residual) = n — (k+1)

In unserem Fall n=100,k=1

df(Rest)=98

**R-Quadrat: **_R_2 ist eine Statistik, die Informationen über die Anpassungsgüte eines Modells liefert. Er reicht von 0 bis 1. In unserem Fall beträgt der Wert von R-Quadrat 0,745, was erklärt, dass 74% der Varianz durch das Modell erklärt werden.

#r-squared #regressionsanalyse #data-science #dw-test #ols #testing

medium.com

So interpretieren Sie die Ergebnisse von OLS

Egal, ob Sie neu in der Datenwissenschaft oder sogar ein erfahrener Veteran sind, die Interpretation der Ergebnisse eines maschinellen Lernalgorithmus kann eine Herausforderung sein. Menschen neigen dazu, OLS-Annahmen zu ignorieren, bevor sie die Ergebnisse interpretieren. Daher ist dies ein wichtiger Schritt für die Analyse verschiedener von OLS veröffentlichter Statistiken.