Der beste Weg, um einen Datensatz zu verstehen, besteht darin, deskriptive Statistiken für die Variablen innerhalb des Datensatzes zu berechnen. Es gibt drei gängige Formen der deskriptiven Statistik:

  1. Zusammenfassungsstatistik – Zahlen, die eine Variable mit einer einzigen Zahl zusammenfassen. Beispiele sind der Mittelwert, der Median, die Standardabweichung und der Bereich.
  2. Tabellen – Tabellen können uns helfen zu verstehen, wie Daten verteilt werden. Ein Beispiel ist eine Häufigkeitstabelle, aus der hervorgeht, wie viele Datenwerte in bestimmte Bereiche fallen.
  3. Grafiken – Diese helfen uns, Daten zu visualisieren. Ein Beispiel wäre ein Histogramm.

In diesem Lernprogramm wird erläutert, wie beschreibende Statistiken für Variablen in SPSS berechnet werden.

Beispiel: Deskriptive Statistik in SPSS

Angenommen, wir haben den folgenden Datensatz, der vier Variablen für 20 Schüler einer bestimmten Klasse enthält:

  • Prüfungsergebnis
  • Stunden studiert
  • Vorbereitungsprüfungen abgelegt
  • Aktuelle Note in der Klasse

Datensatz zur Berechnung deskriptiver Statistik

So berechnen Sie beschreibende Statistiken für jede dieser vier Variablen:

Zusammengefasste Statistiken

Um zusammenfassende Statistiken für jede Variable zu berechnen, klicken Sie auf die Registerkarte Analysieren, dann auf Beschreibende Statistiken und dann auf Beschreiben:

SPSS zusammengefasste Statistiken

Ziehen Sie im neuen Fenster, das angezeigt wird, jede der vier Variablen in das Feld mit der Bezeichnung Variable (n). Wenn Sie möchten, können Sie auf die Schaltfläche Optionen klicken und die spezifischen beschreibenden Statistiken auswählen, die SPSS berechnen soll. Klicken Sie dann auf Weiter. Klicken Sie dann auf OK.

SPSS Erklärung zusammenfassende Statistiken

Sobald Sie auf OK klicken, wird eine Tabelle angezeigt, in der die folgenden beschreibenden Statistiken für jede Variable angezeigt werden:

Deskriptive Statistik in SPSS

So interpretieren Sie die Zahlen in dieser Tabelle für die variable Punktzahl:

  • N: Die Gesamtzahl der Beobachtungen. In diesem Fall gibt es 20.
  • Minimum: Der Mindestwert für die Prüfungspunktzahl. In diesem Fall ist es 68.
  • Maximum: Der maximale Wert für die Prüfungspunktzahl. In diesem Fall ist es 99.
  • Mittelwert: Die durchschnittliche Prüfungspunktzahl. In diesem Fall ist es 82,75.
  • Std. Abweichung: Die Standardabweichung der Prüfungsergebnisse. In diesem Fall ist es 8.985.

Diese Tabelle ermöglicht es uns, den Bereich jeder Variablen (unter Verwendung des Minimums und des Maximums), die zentrale Position jeder Variablen (unter Verwendung des Mittelwerts) und die Verteilung der Werte für jede Variable (unter Verwendung der Standardabweichung) schnell zu verstehen.

Tabellen

Um eine Häufigkeitstabelle für jede Variable zu erstellen, klicken Sie auf die Registerkarte Analysieren, dann auf Beschreibende Statistik und dann auf Häufigkeiten.

SPSS Häufigkeiten

Ziehen Sie im neuen Fenster, das angezeigt wird, jede Variable in das Feld mit der Bezeichnung Variable (n). Klicken Sie dann auf OK.

SPSS Häufigkeiten Erklärung

Eine Häufigkeitstabelle für jede Variable wird angezeigt. Hier ist zum Beispiel die für die variablen Stunden:

Häufigkeitstabelle in SPSS

Die Tabelle kann folgendermaßen interpretiert werden:

  • In der ersten Spalte wird jeder eindeutige Wert für die variablen Stunden angezeigt. In diesem Fall sind die eindeutigen Werte 1, 2, 3, 4, 5, 6 und 16.
  • In der zweiten Spalte wird die Häufigkeit jedes Werts angezeigt. Beispielsweise wird der Wert 1 1 Mal angezeigt, der Wert 2 4 Mal usw.
  • In der dritten Spalte wird der Prozentsatz für jeden Wert angezeigt. Beispielsweise macht der Wert 1 5% aller Werte im Datensatz aus. Der Wert 2 macht 20% aller Werte im Datensatz aus und so weiter.
  • In der letzten Spalte wird der kumulierte Prozentsatz angezeigt. Zum Beispiel machen die Werte 1 und 2 insgesamt 25% des gesamten Datensatzes aus. Die Werte 1, 2 und 3 machen kumulative 60% des Datensatzes aus und so weiter.

Diese Tabelle gibt uns eine gute Vorstellung von der Verteilung der Datenwerte für jede Variable.

Graphen

Diagramme helfen uns auch dabei, die Verteilung der Datenwerte für jede Variable in einem Datensatz zu verstehen. Eines der beliebtesten Diagramme hierfür ist ein Histogramm.

Um ein Histogramm für eine bestimmte Variable in einem Dataset zu erstellen, klicken Sie auf die Registerkarte Diagramme und dann auf Diagramm-Generator.

Wählen Sie im neuen Fenster, das angezeigt wird, im Bereich „Auswählen aus“ die Option Histogramm. Ziehen Sie dann die erste Histogrammoption in das Hauptbearbeitungsfenster. Ziehen Sie dann Ihre interessierende Variable auf die x-Achse. Für dieses Beispiel verwenden wir die Punktzahl. Klicken Sie dann auf OK.

SPSS Diagramme

Sobald Sie auf OK klicken, wird ein Histogramm angezeigt, das die Verteilung der Werte für die Variablenbewertung anzeigt:

Histogramm in SPSS

Aus dem Histogramm können wir ersehen, dass der Bereich der Prüfungsergebnisse zwischen 65 und 100 variiert, wobei die meisten Ergebnisse zwischen 70 und 90 liegen.

Wir können diesen Vorgang wiederholen, um auch für jede der anderen Variablen im Datensatz ein Histogramm zu erstellen.

Statistik in Excel leicht gemacht

"Statistik in Excel leicht gemacht" ist eine Sammlung von 16 Excel-Tabellen, die integrierte Formeln enthalten, um die wichtigsten statistischen Tests und Funktionen durchzuführen.

Statistik in Excel leicht gemacht

Das könnte Sie auch interessieren:
R

So finden Sie den Antilog der Werte in R

Der Antilog einer Zahl ist der Kehrwert des Logarithmus einer Zahl.

Wenn man also den Logarithmus einer Zahl berechnet, kann man den Antilogarithmus verwenden, um die ursprüngliche Zahl zurückzubekommen.

Angenommen …