So berechnen Sie den Standardfehler des Mittelwerts in Python

Der Standardfehler des Mittelwerts ist eine Möglichkeit zu messen, wie verteilt die Werte in einem Datensatz sind. Es wird berechnet als:

Standardfehler des Mittelwerts = s / √n

wo:

s: Standardabweichung der Stichprobe
n: Stichprobengröße

In diesem Artikel werden zwei Methoden erläutert, mit denen Sie den Standardfehler des Mittelwerts für ein Dataset in Python berechnen können. Beachten Sie, dass beide Methoden genau die gleichen Ergebnisse liefern.

Methode 1: Verwenden Sie SciPy

Die erste Möglichkeit, den Standardfehler des Mittelwerts zu berechnen, besteht darin, die Funktion sem() aus der SciPy Stats-Bibliothek zu verwenden.

Der folgende Code zeigt, wie diese Funktion verwendet wird:

from scipy.stats import sem

#Datensatz definieren 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29]

# Standardfehler des Mittelwerts berechnen 
sem(data)

2.001447

Der Standardfehler des Mittelwerts beträgt 2,001447.

Methode 2: Verwenden Sie NumPy

Eine andere Möglichkeit, den Standardfehler des Mittelwerts für einen Datensatz zu berechnen, besteht darin, die Funktion std() von NumPy zu verwenden.

Beachten Sie, dass wir im Argument für diese Funktion ddof = 1 angeben müssen, um die Standardabweichung der Stichprobe im Gegensatz zur Standardabweichung der Grundgesamtheit zu berechnen.

Der folgende Code zeigt, wie das geht:

import numpy as np

#Datensatz definieren
data = np.array([3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29])

# Standardfehler des Mittelwerts berechnen 
np.std(data, ddof=1) / np.sqrt(np.size(data))

2.001447

Der Standardfehler des Mittelwerts beträgt erneut 2,001447.

Interpretation des Standardfehlers des Mittelwerts

Der Standardfehler des Mittelwerts ist lediglich ein Maß dafür, wie weit die Werte um den Mittelwert verteilt sind. Bei der Interpretation des Standardfehlers des Mittelwerts sind zwei Dinge zu beachten:

1. Je größer der Standardfehler des Mittelwerts ist, desto mehr verteilte Werte liegen um den Mittelwert in einem Datensatz.

Um dies zu veranschaulichen, sollten Sie überlegen, ob wir den letzten Wert im vorherigen Datensatz in eine viel größere Zahl ändern:

from scipy.stats import sem

#Datensatz definieren 
data = [3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150]

#Standardfehler des Mittelwerts berechnen 
sem(data)

6.978265

Beachten Sie, wie der Standardfehler von 2.001447 auf 6.978265 springt. Dies ist ein Hinweis darauf, dass die Werte in diesem Datensatz im Vergleich zum vorherigen Datensatz stärker um den Mittelwert verteilt sind.

2. Mit zunehmender Stichprobengröße nimmt der Standardfehler des Mittelwerts tendenziell ab.

Um dies zu veranschaulichen, betrachten Sie den Standardfehler des Mittelwerts für die folgenden zwei Datensätze:

from scipy.stats import sem 

# Definieren Sie den ersten Datensatz und finden Sie SEM
data1 = [1, 2, 3, 4, 5]
sem(data1)

0.7071068

# Definieren Sie den zweiten Datensatz und suchen Sie das SEM
data2 = [1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
sem(data2)

0.4714045

Der zweite Datensatz ist einfach der erste Datensatz, der zweimal wiederholt wird. Somit haben die beiden Datensätze den gleichen Mittelwert, aber der zweite Datensatz hat eine größere Stichprobengröße, sodass er einen kleineren Standardfehler aufweist.

Zusätzliche Ressourcen

So berechnen Sie den Standardfehler des Mittelwerts in R
So berechnen Sie den Standardfehler des Mittelwerts in Excel
So berechnen Sie den Standardfehler des Mittelwerts in Google Tabellen

Methode 1: Verwenden Sie SciPy

Methode 2: Verwenden Sie NumPy

Interpretation des Standardfehlers des Mittelwerts

Zusätzliche Ressourcen

Statistik: Der Weg zur Datenanalyse

So führen Sie eine Median-IF-Funktion in Google Tabellen aus

So berechnen Sie die prozentuale Änderung in Google Tabellen (mit Beispielen)