Erkunden deskriptiver Statistiken mit Pandas und Seaborn

Blog

Erkunden deskriptiver Statistiken mit Pandas und Seaborn

Beschreibende Statistik in Python

Deskriptive Statistiken umfassen solche, die die zentrale Tendenz, Streuung und Form der Verteilung eines Datensatzes zusammenfassen.

  1. Maß der zentralen Tendenz
  2. Maß der Ausbreitung/Dispersion
  3. Symmetriemaß [wird dies für den zukünftigen Beitrag speichern]

Datensatz

Importierte alle Bibliotheken, die für statistische Diagramme benötigt werden, und erstellte einen Datenrahmen aus dem Datensatz in der Datei |_+_|.

Dieser Datensatz enthält die Spalten Größe, Gewicht, Alter, BMI und Geschlecht. Lassen Sie uns beschreibende Statistiken für diesen Datensatz berechnen.

Der in diesem Projekt verwendete Code ist verfügbar als Jupyter Notebook auf GitHub .

bmi.csv

Bild für Beitrag

Datenrahmen

Maß der zentralen Tendenz

Das Maß der zentralen Tendenz wird verwendet, um den mittleren/mittleren Wert der Daten zu beschreiben.

|_+_| sind Maße der zentralen Tendenz.

1. Mittel

  • Mittelwert ist der |_+_| des Datensatzes.
  • Der Mittelwert wird berechnet, indem alle Werte im Datensatz dividiert durch die Anzahl der Werte im Datensatz addiert werden.
  • Wir können den Mittelwert nur für numerische Variablen berechnen

Formel zur Berechnung des Mittelwerts

Bild für Beitrag

#programmierung #python3 #pandas #python #data-science

7 Arten von Absätzen

medium.com

Erkunden deskriptiver Statistiken mit Pandas und Seaborn

Untersuchen deskriptiver Statistiken mit Pandas und Seaborn. Quantitativer Ansatz und visueller Ansatz