So berechnen Sie deskriptive Statistiken für Variablen in SPSS

Der beste Weg, um einen Datensatz zu verstehen, besteht darin, deskriptive Statistiken für die Variablen innerhalb des Datensatzes zu berechnen. Es gibt drei gängige Formen der deskriptiven Statistik:

Zusammenfassungsstatistik – Zahlen, die eine Variable mit einer einzigen Zahl zusammenfassen. Beispiele sind der Mittelwert, der Median, die Standardabweichung und der Bereich.
Tabellen – Tabellen können uns helfen zu verstehen, wie Daten verteilt werden. Ein Beispiel ist eine Häufigkeitstabelle, aus der hervorgeht, wie viele Datenwerte in bestimmte Bereiche fallen.
Grafiken – Diese helfen uns, Daten zu visualisieren. Ein Beispiel wäre ein Histogramm.

In diesem Lernprogramm wird erläutert, wie beschreibende Statistiken für Variablen in SPSS berechnet werden.

Beispiel: Deskriptive Statistik in SPSS

Angenommen, wir haben den folgenden Datensatz, der vier Variablen für 20 Schüler einer bestimmten Klasse enthält:

Prüfungsergebnis
Stunden studiert
Vorbereitungsprüfungen abgelegt
Aktuelle Note in der Klasse

So berechnen Sie beschreibende Statistiken für jede dieser vier Variablen:

Zusammengefasste Statistiken

Um zusammenfassende Statistiken für jede Variable zu berechnen, klicken Sie auf die Registerkarte Analysieren, dann auf Beschreibende Statistiken und dann auf Beschreiben:

Ziehen Sie im neuen Fenster, das angezeigt wird, jede der vier Variablen in das Feld mit der Bezeichnung Variable (n). Wenn Sie möchten, können Sie auf die Schaltfläche Optionen klicken und die spezifischen beschreibenden Statistiken auswählen, die SPSS berechnen soll. Klicken Sie dann auf Weiter. Klicken Sie dann auf OK.

Sobald Sie auf OK klicken, wird eine Tabelle angezeigt, in der die folgenden beschreibenden Statistiken für jede Variable angezeigt werden:

So interpretieren Sie die Zahlen in dieser Tabelle für die variable Punktzahl:

N: Die Gesamtzahl der Beobachtungen. In diesem Fall gibt es 20.
Minimum: Der Mindestwert für die Prüfungspunktzahl. In diesem Fall ist es 68.
Maximum: Der maximale Wert für die Prüfungspunktzahl. In diesem Fall ist es 99.
Mittelwert: Die durchschnittliche Prüfungspunktzahl. In diesem Fall ist es 82,75.
Std. Abweichung: Die Standardabweichung der Prüfungsergebnisse. In diesem Fall ist es 8.985.

Diese Tabelle ermöglicht es uns, den Bereich jeder Variablen (unter Verwendung des Minimums und des Maximums), die zentrale Position jeder Variablen (unter Verwendung des Mittelwerts) und die Verteilung der Werte für jede Variable (unter Verwendung der Standardabweichung) schnell zu verstehen.

Tabellen

Um eine Häufigkeitstabelle für jede Variable zu erstellen, klicken Sie auf die Registerkarte Analysieren, dann auf Beschreibende Statistik und dann auf Häufigkeiten.

Ziehen Sie im neuen Fenster, das angezeigt wird, jede Variable in das Feld mit der Bezeichnung Variable (n). Klicken Sie dann auf OK.

Eine Häufigkeitstabelle für jede Variable wird angezeigt. Hier ist zum Beispiel die für die variablen Stunden:

Die Tabelle kann folgendermaßen interpretiert werden:

In der ersten Spalte wird jeder eindeutige Wert für die variablen Stunden angezeigt. In diesem Fall sind die eindeutigen Werte 1, 2, 3, 4, 5, 6 und 16.
In der zweiten Spalte wird die Häufigkeit jedes Werts angezeigt. Beispielsweise wird der Wert 1 1 Mal angezeigt, der Wert 2 4 Mal usw.
In der dritten Spalte wird der Prozentsatz für jeden Wert angezeigt. Beispielsweise macht der Wert 1 5% aller Werte im Datensatz aus. Der Wert 2 macht 20% aller Werte im Datensatz aus und so weiter.
In der letzten Spalte wird der kumulierte Prozentsatz angezeigt. Zum Beispiel machen die Werte 1 und 2 insgesamt 25% des gesamten Datensatzes aus. Die Werte 1, 2 und 3 machen kumulative 60% des Datensatzes aus und so weiter.

Diese Tabelle gibt uns eine gute Vorstellung von der Verteilung der Datenwerte für jede Variable.

Graphen

Diagramme helfen uns auch dabei, die Verteilung der Datenwerte für jede Variable in einem Datensatz zu verstehen. Eines der beliebtesten Diagramme hierfür ist ein Histogramm.

Um ein Histogramm für eine bestimmte Variable in einem Dataset zu erstellen, klicken Sie auf die Registerkarte Diagramme und dann auf Diagramm-Generator.

Wählen Sie im neuen Fenster, das angezeigt wird, im Bereich „Auswählen aus“ die Option Histogramm. Ziehen Sie dann die erste Histogrammoption in das Hauptbearbeitungsfenster. Ziehen Sie dann Ihre interessierende Variable auf die x-Achse. Für dieses Beispiel verwenden wir die Punktzahl. Klicken Sie dann auf OK.

Sobald Sie auf OK klicken, wird ein Histogramm angezeigt, das die Verteilung der Werte für die Variablenbewertung anzeigt:

Aus dem Histogramm können wir ersehen, dass der Bereich der Prüfungsergebnisse zwischen 65 und 100 variiert, wobei die meisten Ergebnisse zwischen 70 und 90 liegen.

Wir können diesen Vorgang wiederholen, um auch für jede der anderen Variablen im Datensatz ein Histogramm zu erstellen.

Beispiel: Deskriptive Statistik in SPSS

Zusammengefasste Statistiken

Tabellen

Graphen

Statistik in Excel leicht gemacht

So finden Sie den Antilog der Werte in R

So berechnen Sie die AUC (Area under Curve) in R