Kendall’sches Tau: Definition + Beispiel

Von Fabian
Kategorie: Tutorials
Lesezeit: 4 Minuten

In der Statistik bezieht sich die Korrelation auf die Stärke und Richtung einer Beziehung zwischen zwei Variablen. Der Wert eines Korrelationskoeffizienten kann im Bereich von -1 bis 1 liegen, wobei -1 eine perfekte negative Beziehung anzeigt, 0 keine Beziehung anzeigt und 1 eine perfekte positive Beziehung anzeigt.

Der am häufigsten verwendete Korrelationskoeffizient ist der Pearson-Korrelationskoeffizient, der die lineare Assoziation zwischen zwei numerischen Variablen misst. Ein weniger häufig verwendeter Korrelationskoeffizient ist Kendall’sches Tau, der die Beziehung zwischen zwei Spalten mit Rangdaten misst.

Die Formel zur Berechnung des Kendall’schen Taus, oft mit τ abgekürzt, lautet wie folgt:

τ = (CD) / (C + D)

wobei:

  • C = die Anzahl der übereinstimmenden Paare
  • D = Anzahl der nicht übereinstimmenden Paare

Das folgende Beispiel zeigt, wie diese Formel verwendet wird, um den Kendall’schen Rangkorrelationskoeffizienten für zwei Spalten mit Rangdaten zu berechnen.

Beispiel für die Berechnung des Kendall’schen Taus

Angenommen, zwei Basketballtrainer rangieren 12 ihrer Spieler vom schlechtesten zum besten. Die folgende Tabelle zeigt die Ranglisten, die jeder Trainer den Spielern zugewiesen hat:

Kendalls Tau-Beispiel

Da wir mit zwei Spalten mit Rangdaten arbeiten, ist es angebracht, das Kendall’sche Tau zu verwenden, um die Korrelation zwischen den Ranglisten der beiden Trainer zu berechnen. Verwenden Sie die folgenden Schritte, um das Kendall’sche Tau zu berechnen:

Schritt 1: Zählen Sie die Anzahl der übereinstimmenden Paare.

Schauen Sie sich nur die Ränge für Coach # 2 an. Zählen Sie ab dem ersten Spieler, wie viele Ränge unter ihm größer sind. Zum Beispiel gibt es 11 Zahlen unter „1“, die größer sind, also schreiben wir 11:

Kendalls Tau-Datensatz

Gehen Sie zum nächsten Spieler und wiederholen Sie den Vorgang. Es gibt 10 Zahlen unter „2“, die größer sind, also schreiben wir 10:

Berechnung der Tau-Konkordanzpaare von Kendalls

Sobald wir einen Spieler erreichen, dessen Rang niedriger ist als der Spieler vor ihm, weisen wir ihm einfach den gleichen Wert zu wie dem Spieler vor ihm. Zum Beispiel hat Elliot einen Rang von „4“, der niedriger ist als der Rang des vorherigen Spielers von „5“, also weisen wir ihm einfach den gleichen Wert zu wie dem Spieler vor ihm:

Kendalls Tau

Wiederholen Sie diesen Vorgang für alle Spieler:

Kendalls Tau

Schritt 2: Zählen Sie die Anzahl der nicht übereinstimmenden Paare.

Schauen Sie sich auch hier nur die Ränge für Trainer Nr. 2 an. Zählen Sie für jeden Spieler, wie viele Ränge unter ihm kleiner sind. Zum Beispiel hat Trainer # 2 AJ einen Rang von „1“ zugewiesen und es gibt keine Spieler unter ihm mit einem kleineren Rang. Daher weisen wir ihm den Wert 0 zu:

Kendalls Tau-Berechnung für nicht übereinstimmende Paare

Wiederholen Sie diesen Vorgang für jeden Spieler:

Kendalls Tau-Beispiel

Schritt 3: Berechnen Sie die Summe jeder Spalte und finden Sie das Kendall’sche Tau.

Kendalls Tau-Berechnung

Kendall’sches Tau = (CD) / (C + D) = (63-3) / (63 + 3) = (60/66) = 0,909.

Statistische Bedeutung des Kendall’schen Tau

Wenn Sie mehr als n = 10 Paare haben, folgt das Kendall’sche Tau im Allgemeinen einer Normalverteilung. Sie können die folgende Formel verwenden, um einen Z-Score für das Kendall’sche Tau zu berechnen:

z = 3τ * √ n (n-1) / √ 2 (2n + 5)

wo:

  • τ = Wert, den Sie für das Kendall’sche Tau berechnet haben
  • n = Anzahl der Paare

So berechnen Sie z für das vorherige Beispiel:

z = 3 (0,909) * √ 12 (12-1) / √ 2 (2 * 12 + 5) = 4,11.

Nach Berechnung sehen wir, dass der p-Wert für diesen Z-Score 0,00004 beträgt, was bei Alpha-Level 0,05 statistisch signifikant ist. Somit besteht eine statistisch signifikante Korrelation zwischen den Rängen, die die beiden Trainer den Spielern zugewiesen haben.

Bonus: Wie man das Kendall’sche Tau in R berechnet

In der Statistiksoftware R können Sie die Funktion kendall.tau() aus der VGAM-Bibliothek verwenden, um das Kendall’sche Tau für zwei Vektoren zu berechnen, wobei die folgende Syntax verwendet wird:

kendall.tau(x, y)

wobei x und y zwei numerische Vektoren gleicher Länge sind.

Der folgende Code zeigt, wie das Kendall’sche Tau für die genauen Daten berechnet wird, die wir im vorherigen Beispiel verwendet haben:

#Lade VGAM
library(VGAM)
#Erstelle einen Vektor für die Rangliste jedes Trainers
coach_1 <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)
coach_2 <- c(1, 2, 3, 5, 4, 7, 6, 8, 10, 9, 11, 12)

#Kendall'sches Tau berechnen
kendall.tau(coach_1, coach_2)
# [1] 0,9090909

Beachten Sie, wie der Wert für das Kendall’sche Tau mit dem Wert übereinstimmt, den wir von Hand berechnet haben.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: