Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Ein Bland-Altman-Diagramm wird verwendet, um die Unterschiede in den Messungen zwischen zwei verschiedenen Instrumenten oder zwei verschiedenen Messverfahren zu visualisieren.
Es ist nützlich, um festzustellen, wie ähnlich zwei Instrumente oder Techniken bei der Messung desselben Konstrukts sind.
Dieses Tutorial bietet ein schrittweises Beispiel für die Erstellung eines Bland-Altman-Diagramms in R.
Angenommen, ein Biologe verwendet zwei verschiedene Instrumente (A und B), um das Gewicht der gleichen Gruppe von 20 verschiedenen Fröschen in Gramm zu messen.
Wir erstellen den folgenden Dataframe in R, der das Gewicht jedes Frosches darstellt, wie es von jedem Instrument gemessen wurde:
#Daten erstellen
df <- data.frame(A=c(5, 5, 5, 6, 6, 7, 7, 7, 8, 8, 9,
10, 11, 13, 14, 14, 15, 18, 22, 25),
B=c(4, 4, 5, 5, 5, 7, 8, 6, 9, 7, 7, 11,
13, 13, 12, 13, 14, 19, 19, 24))
#Ansicht der ersten sechs Datenzeilen
head(df)
A B
1 5 4
2 5 4
3 5 5
4 6 5
5 6 5
6 7 7
Als Nächstes erstellen wir zwei neue Spalten im Dataframe, die die durchschnittliche Messung für jeden Frosch sowie die Differenz der Messungen enthalten:
#Erstellen einer neuen Spalte für die Durchschnittsmessung
df$avg <- rowMeans(df)
#Erstellen einer neuen Spalte für die Differenz der Messungen
df$diff <- df$A - df$B
#Die ersten sechs Datenzeilen anzeigen
head(df)
A B avg diff
1 5 4 4.5 1
2 5 4 4.5 1
3 5 5 5.0 0
4 6 5 5.5 1
5 6 5 5.5 1
6 7 7 7.0 0
Als Nächstes berechnen wir die durchschnittliche Differenz der Messwerte zwischen den beiden Instrumenten sowie die oberen und unteren 95%-Konfidenzintervallgrenzen für die durchschnittliche Differenz:
#Ermitteln der durchschnittlichen Differenz
mean_diff <- mean(df$diff)
mean_diff
[1] 0.5
#Untere 95%-Konfidenzintervallgrenzen finden
lower <- mean_diff - 1.96*sd(df$diff)
lower
[1] -1.921465
#Obere 95%-Konfidenzintervallgrenzen finden
upper <- mean_diff + 1.96*sd(df$diff)
upper
[1] 2.921465
Die durchschnittliche Differenz beträgt 0,5 und das 95%-Konfidenzintervall für die durchschnittliche Differenz ist [-1,921, 2,921].
Als Nächstes verwenden wir den folgenden Code, um ein Bland-Altman-Diagramm mit dem ggplot2 Datenvisualisierungspaket zu erstellen:
#ggplot2 laden
library(ggplot2)
#Erstellen eines Bland-Altman-Plots
ggplot(df, aes(x = avg, y = diff)) +
geom_point(size=2) +
geom_hline(yintercept = mean_diff) +
geom_hline(yintercept = lower, color = "red", linetype="dashed") +
geom_hline(yintercept = upper, color = "red", linetype="dashed") +
ggtitle("Bland-Altman Plot") +
ylab("Difference Between Measurements") +
xlab("Average Measurement")
Die x-Achse des Diagramms zeigt die durchschnittliche Messung der beiden Instrumente und die y-Achse zeigt die Differenz der Messungen zwischen den beiden Instrumenten an.
Die schwarze Linie stellt die durchschnittliche Differenz der Messungen zwischen den beiden Instrumenten dar, während die beiden roten gestrichelten Linien die 95%-Konfidenzintervallgrenzen für die durchschnittliche Differenz darstellen.
Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Bei der Verwendung von Klassifizierungsmodellen beim maschinellen Lernen verwenden wir häufig zwei Metriken, um die Qualität des Modells zu bewerten, nämlich Präzision und Erinnerung.
Precision: Korrigieren Sie positive Vorhersagen im …