Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Das Anscombe-Quartett ist eine Sammlung von vier Datensätzen, die alle über identische deskriptive Statistiken verfügen, jedoch in einem Diagramm stark unterschiedliche Verteilungen aufweisen.
Die vier Datensätze sind unten dargestellt:
Dieses Tutorial bietet ein Schritt-für-Schritt-Beispiel zum Erstellen von eines Anscombe-Quartetts in Excel.
Zuerst können wir die Rohdatenwerte für jeden Datensatz in Excel eingeben:
Als Nächstes können wir Streudiagramme erstellen, um jeden Datensatz zu visualisieren.
Um ein Streudiagramm für das erste Dataset zu erstellen, markieren Sie die Zellen B3:C13 wie unten gezeigt:
Klicken Sie anschließend im oberen Menüband auf die Registerkarte Einfügen. Dann klicken Sie auf Einfügen Streudiagramm(X, Y) innerhalb der Gruppe Diagramme:
Wenn Sie auf die erste Option in dieser Gruppe klicken, wird das folgende Streudiagramm angezeigt:
Wiederholen Sie diesen Vorgang für jeden Datensatz.
Wir können auch den Mittelwert, die Varianz und die Korrelation jedes Datensatzes berechnen, um zu zeigen, dass sie alle gleich sind.
Die folgenden Formeln zeigen, wie diese Metriken für die x-Werte im ersten Datensatz berechnet werden:
(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)
Kopieren Sie diese Formeln und fügen Sie sie ein, um die Metriken für jeden Datensatz zu berechnen:
Beachten Sie, dass die Metriken für jedes Dataset genau gleich sind.
Der ganze Sinn von Anscombes Quartett besteht darin, die Bedeutung der Datenvisualisierung zu zeigen.
Wenn wir uns nur die deskriptiven Statistiken für jeden Datensatz ansehen, scheint jeder Datensatz identisch zu sein. Wenn wir jedoch tatsächlich Grafiken erstellen, können wir sehen, dass die Datensätze ziemlich unterschiedlich sind.
Deskriptive Statistiken können Daten numerisch zusammenfassen, aber Grafiken können uns dabei helfen, Daten zu visualisieren. Aus diesem Grund ist es wichtig, Grafiken und Diagramme zu erstellen, bevor Sie einen Datensatz analysieren und Schlussfolgerungen ziehen.
Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Bei der Verwendung von Klassifizierungsmodellen beim maschinellen Lernen verwenden wir häufig zwei Metriken, um die Qualität des Modells zu bewerten, nämlich Präzision und Erinnerung.
Precision: Korrigieren Sie positive Vorhersagen im …