Der beste Weg, um einen Datensatz zu verstehen, besteht darin, beschreibende Statistiken für die Variablen innerhalb des Datensatzes zu berechnen. Es gibt drei gängige Formen der deskriptiven Statistik:

  1. Zusammenfassungsstatistik – Zahlen, die eine Variable mit einer einzigen Zahl zusammenfassen. Beispiele sind der Mittelwert, der Median, die Standardabweichung und der Bereich.
  2. Tabellen – Tabellen können uns helfen zu verstehen, wie Daten verteilt werden. Ein Beispiel ist eine Häufigkeitstabelle, aus der hervorgeht, wie viele Datenwerte in bestimmte Bereiche fallen.
  3. Grafiken – Diese helfen uns, Daten zu visualisieren. Ein Beispiel wäre ein Histogramm.

Beispiel: Beschreibende Statistik in SPSS

Angenommen, wir haben den folgenden Datensatz, der vier Variablen für 20 Schüler einer bestimmten Klasse enthält:

  • Prüfungsergebnis
  • Stunden studiert
  • Vorbereitungsprüfungen abgelegt
  • Aktuelle Note in der Klasse

Rohdaten SPSS

So berechnen Sie beschreibende Statistiken für jede dieser vier Variablen:

Zusammengefasste Statistiken

Um zusammenfassende Statistiken für jede Variable zu berechnen, klicken Sie auf die Registerkarte Analysieren, dann auf Beschreibende Statistiken und dann auf Beschreiben:

Zusammenfassung Statistik in SPSS

Ziehen Sie im neuen Fenster, das angezeigt wird, jede der vier Variablen in das Feld mit der Bezeichnung Variable (n). Wenn Sie möchten, können Sie auf die Schaltfläche Optionen klicken und die spezifischen beschreibenden Statistiken auswählen, die SPSS berechnen soll. Klicken Sie dann auf Weiter. Klicken Sie dann auf OK.

Zusammenfassende Statistiken in SPSS

Sobald Sie auf OK klicken, wird eine Tabelle angezeigt, in der die folgenden beschreibenden Statistiken für jede Variable angezeigt werden:

Beschreibende Statistik in SPSS

So interpretieren Sie die Zahlen in dieser Tabelle für die variable Punktzahl:

  • N: Die Gesamtzahl der Beobachtungen. In diesem Fall gibt es 20.
  • Minimum: Der Mindestwert für die Prüfungspunktzahl. In diesem Fall ist es 68.
  • Maximum: Der maximale Wert für die Prüfungspunktzahl. In diesem Fall ist es 99.
  • Mittelwert: Die durchschnittliche Prüfungspunktzahl. In diesem Fall ist es 82,75.
  • Std. Abweichung: Die Standardabweichung der Prüfungsergebnisse. In diesem Fall ist es 8.985.

Diese Tabelle ermöglicht es uns, den Bereich jeder Variablen (unter Verwendung des Minimums und des Maximums), die zentrale Position jeder Variablen (unter Verwendung des Mittelwerts) und die Verteilung der Werte für jede Variable (unter Verwendung der Standardabweichung) schnell zu verstehen.

Tabellen

Um eine Häufigkeitstabelle für jede Variable zu erstellen, klicken Sie auf die Registerkarte Analysieren, dann auf Beschreibende Statistik und dann auf Häufigkeiten.

Häufigkeiten in SPSS

Ziehen Sie im neuen Fenster, das angezeigt wird, jede Variable in das Feld mit der Bezeichnung Variable (n). Klicken Sie dann auf OK.

Häufigkeiten in SPSS

Eine Häufigkeitstabelle für jede Variable wird angezeigt. Hier ist zum Beispiel die für die Variable hours:

Häufigkeitstabelle in SPSS

Die Tabelle kann folgendermaßen interpretiert werden:

  • In der ersten Spalte wird jeder eindeutige Wert für die variablen Stunden angezeigt. In diesem Fall sind die eindeutigen Werte 1, 2, 3, 4, 5, 6 und 16.
  • In der zweiten Spalte wird die Häufigkeit jedes Werts angezeigt. Beispielsweise wird der Wert 1 1 Mal angezeigt, der Wert 2 4 Mal usw.
  • In der dritten Spalte wird der Prozentsatz für jeden Wert angezeigt. Beispielsweise macht der Wert 1 5% aller Werte im Datensatz aus. Der Wert 2 macht 20% aller Werte im Datensatz aus und so weiter.
  • In der letzten Spalte wird der kumulierte Prozentsatz angezeigt. Beispielsweise machen die Werte 1 und 2 insgesamt 25% des gesamten Datensatzes aus. Die Werte 1, 2 und 3 machen kumulative 60% des Datensatzes aus und so weiter.

Diese Tabelle gibt uns eine gute Vorstellung von der Verteilung der Datenwerte für jede Variable.

Grafiken

Diagramme helfen uns auch dabei, die Verteilung der Datenwerte für jede Variable in einem Datensatz zu verstehen. Eines der beliebtesten Diagramme hierfür ist ein Histogramm.

Um ein Histogramm für eine bestimmte Variable in einem Dataset zu erstellen, klicken Sie auf die Registerkarte Diagramme und dann auf Diagramm-Generator.

Wählen Sie im neuen Fenster, das angezeigt wird, im Bereich „Auswählen“ die Option Histogramm. Ziehen Sie dann die erste Histogrammoption in das Hauptbearbeitungsfenster. Ziehen Sie dann Ihre interessierende Variable auf die x-Achse. Für dieses Beispiel verwenden wir die Punktzahl. Klicken Sie dann auf OK.

Histogramm in SPSS 1

Sobald Sie auf OK klicken, wird ein Histogramm angezeigt, das die Verteilung der Werte für die variable Bewertung anzeigt:

Histogramm in SPSS 2

Aus dem Histogramm können wir ersehen, dass der Bereich der Prüfungsergebnisse zwischen 65 und 100 variiert, wobei die meisten Ergebnisse zwischen 70 und 90 liegen.

Wir können diesen Vorgang wiederholen, um auch für jede der anderen Variablen im Datensatz ein Histogramm zu erstellen.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: