Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Ein Paardiagramm ist eine Matrix von Streudiagrammen, die es Ihnen ermöglicht, die paarweise Beziehung zwischen verschiedenen Variablen in einem Datensatz zu verstehen.
Glücklicherweise ist es einfach, ein Paardiagramm in R zu erstellen, indem man die Funktion pairs() verwendet. Dieser Lehrgang enthält mehrere Beispiele für die praktische Anwendung dieser Funktion.
Der folgende Code veranschaulicht, wie man in R eine einfache Paardarstellung für alle Variablen in einem Dataframe erstellt:
#das Beispiel reproduzierbar machen
set.seed(0)
#Erstellen eines Dataframes
var1 <- rnorm(1000)
var2 <- var1 + rnorm(1000, 0, 2)
var3 <- var2 - rnorm(1000, 0, 5)
df <- data.frame(var1, var2, var3)
#Paardiagramm erstellen
pairs(df)
Die Matrix ist wie folgt zu interpretieren:
Dieses einzelne Diagramm gibt uns einen Eindruck von der Beziehung zwischen jedem Variablenpaar in unserem Datensatz. Zum Beispiel scheinen Var1 und Var2 positiv korreliert zu sein, während Var1 und Var3 wenig bis gar nicht korreliert zu sein scheinen.
Der folgende Code veranschaulicht, wie man ein einfaches Paardiagramm nur für die ersten beiden Variablen in einem Datensatz erstellt:
#erstelle ein Paardiagramm nur für var1 und var2
pairs(df[, 1:2])
Der folgende Code veranschaulicht, wie die Ästhetik eines Paardiagramms, einschließlich des Titels, der Farbe und der Beschriftungen, geändert werden kann:
pairs(df,
col = 'blue', #Farbe anpassen
labels = c('First', 'Second', 'Third'), #Label anpassen
main = 'Custom Title') #Titel anpassen
Sie können auch den Pearson Korrelationskoeffizienten zwischen Variablen erhalten, indem Sie die Funktion ggpairs() aus der GGally-Bibliothek verwenden. Der folgende Code veranschaulicht, wie man diese Funktion verwendet:
#Installation der notwendigen Bibliotheken
install.packages('ggplot2')
install.packages('GGally')
#Bibliotheken laden
library(ggplot2)
library(GGally)
#Paarplot erstellen
ggpairs(df)
Diese Matrix ist wie folgt zu interpretieren:
Der Vorteil der Verwendung von ggpairs() gegenüber der R-Basisfunktion pairs() besteht darin, dass Sie mehr Informationen über die Variablen erhalten können. Insbesondere können Sie den Korrelationskoeffizienten zwischen jeder paarweisen Kombination von Variablen sowie ein Dichte-Diagramm für jede einzelne Variable sehen.
Die vollständige Dokumentation für die Funktion ggpairs() finden Sie hier.
Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Bei der Verwendung von Klassifizierungsmodellen beim maschinellen Lernen verwenden wir häufig zwei Metriken, um die Qualität des Modells zu bewerten, nämlich Präzision und Erinnerung.
Precision: Korrigieren Sie positive Vorhersagen im …