Sie können schnell eine Normalverteilung in Python generieren, indem Sie die Funktion numpy.random.normal() verwenden, die die folgende Syntax verwendet:

numpy.random.normal(loc=0.0, scale=1.0, size=None)

wo:

  • loc: Mittelwert der Verteilung. Standard ist 0.
  • scala: Standardabweichung der Verteilung. Standard ist 1.
  • size: Stichprobengröße.

Dieses Tutorial zeigt ein Beispiel für die Verwendung dieser Funktion zum Generieren einer Normalverteilung in Python.

Verwandt: Wie man eine Glockenkurve in Python macht

Beispiel: Generieren Sie eine Normalverteilung in Python

Der folgende Code zeigt, wie eine Normalverteilung in Python generiert wird:

from numpy.random import seed
from numpy.random import normal

#Machen Sie dieses Beispiel reproduzierbar
seed(1)

# Generieren Sie eine Stichprobe von 200 Werten, die einer Normalverteilung folgen 
data = normal(loc=0, scale=1, size=200)

# Die ersten sechs Werte anzeigen
data[0:5]

array([ 1.62434536, -0.61175641, -0.52817175, -1.07296862,  0.86540763])

Wir können schnell den Mittelwert und die Standardabweichung dieser Verteilung finden:

import numpy as np

# Mittelwert der Stichprobe finden
np.mean(data)

0.1066888148479486

# Standardabweichung der Probe finden
np.std(data, ddof=1)

0.9123296653173484

Wir können auch ein Histogramm erstellen, um die Verteilung der Datenwerte zu visualisieren:

import matplotlib.pyplot as plt
count, bins, ignored = plt.hist(data, 30)
plt.show()

Generieren Sie eine Normalverteilung in Python

Wir können sogar einen Shapiro-Wilk-Test durchführen, um festzustellen, ob der Datensatz aus einer normalen Population stammt:

from scipy.stats import shapiro

shapiro(data)

ShapiroResult(statistic=0.9958659410, pvalue=0.8669294714)

Der p-Wert des Tests beträgt 0,8669. Da dieser Wert nicht kleiner als 0,05 ist, können wir davon ausgehen, dass die Beispieldaten aus einer Population stammen, die normal verteilt ist.

Dieses Ergebnis sollte nicht überraschen, da wir die Daten mit der Funktion numpy.random.normal() generiert haben, die eine zufällige Stichprobe von Daten generiert, die aus einer Normalverteilung stammen.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: