Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …
Eine Zeitreihe wird als „stationär“ bezeichnet, wenn sie keinen Trend aufweist, über die Zeit eine konstante Varianz aufweist und über die Zeit eine konstante Autokorrelationsstruktur aufweist.
Eine Möglichkeit zu testen …
Der symmetrische mittlere absolute prozentuale Fehler (SMAPE) wird verwendet, um die Vorhersagegenauigkeit von Modellen zu messen. Es wird berechnet als:
SMAPE = (1/n) * Σ(|Prognose – Ist| / ((|Ist| + |Prognose|)/2) * 100 …
Eine naive Prognose ist eine Prognose, bei der die Prognose für einen bestimmten Zeitraum einfach dem in der vorherigen Periode beobachteten Wert entspricht.
Angenommen, wir haben in den ersten drei …
Rollierende Korrelationen sind Korrelationen zwischen zwei Zeitreihen in einem rollierenden Fenster. Ein Vorteil dieser Art von Korrelation besteht darin, dass Sie die Korrelation zwischen zwei Zeitreihen im Zeitverlauf visualisieren können …
Ein kumulativer Durchschnitt gibt uns den Durchschnitt einer Reihe von Werten bis zu einem bestimmten Punkt an.
Das folgende Schritt-für-Schritt-Beispiel zeigt, wie Sie einen kumulativen Durchschnitt für einen Datensatz in …
In der Statistik ist der mittlere absolute Fehler (MAE, engl. mean absolute error) eine Möglichkeit, die Genauigkeit eines bestimmten Modells zu messen. Es wird berechnet als:
MAE = (1/n) * Σ …
Die Autokorrelation misst den Ähnlichkeitsgrad zwischen einer Zeitreihe und einer verzögerten Version von sich selbst über aufeinanderfolgende Zeitintervalle.
Es wird manchmal auch als "serielle Korrelation" oder "verzögerte Korrelation" bezeichnet, da …
Der gleitende Durchschnitt ist einfach der Mittelwert einer bestimmten Anzahl vorheriger Perioden in einer Zeitreihe.
Um den rollierenden Mittelwert für eine oder mehrere Spalten in einem Pandas DataFrame zu berechnen …
Die mittlere absolute Abweichung misst die Streuung der Beobachtungen in einem Datensatz.
Dies ist eine besonders nützliche Metrik, da sie weniger von Ausreißern betroffen ist als andere Streuungsmaße wie Standardabweichung …
In der Zeitreihenanalyse ist ein gleitender Durchschnitt einfach der Durchschnittswert einer bestimmten Anzahl vorheriger Perioden.
Ein exponentieller gleitender Durchschnitt ist eine Art gleitender Durchschnitt, der jüngsten Beobachtungen mehr Gewicht verleiht …
Der mittlere absolute prozentuale Fehler (MAPE) wird üblicherweise verwendet, um die Vorhersagegenauigkeit von Modellen zu messen. Es wird berechnet als:
MAPE = (1 / n) * Σ (| actual - prediction | / | actual |) * 100
wo:
Der mittlere quadratische Fehler (engl. Mean Squared Error - MSE) ist eine übliche Methode zur Messung der Vorhersagegenauigkeit eines Modells. Es wird berechnet als:
MSE = (1 / n) * Σ (actual - prediction) 2 …
Der Root Mean Square Error (RMSE) ist eine Metrik, die angibt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einem Modell im Durchschnitt entfernt sind. Es wird berechnet …
Rollende Korrelationen sind Korrelationen zwischen zwei Zeitreihen in einem rollenden Fenster. Ein Vorteil dieser Art von Korrelation besteht darin, dass Sie die Korrelation zwischen zwei Zeitreihen über die Zeit visualisieren …
Der einfachste Weg, ein Dataframe um einen Datumsbereich in R zu unterteilen, ist die Verwendung der folgenden Syntax:
df[df$date >= "some date" & df$date <= "some date", ]
Dieses Tutorial enthält …
In der Zeitreihenanalyse ist ein gleitender Durchschnitt einfach der Durchschnittswert einer bestimmten Anzahl vorheriger Perioden.
Ein exponentieller gleitender Durchschnitt ist eine Art gleitender Durchschnitt, der jüngsten Beobachtungen mehr Gewicht verleiht …
Gelegentlich möchten Sie möglicherweise tägliche Daten zu wöchentlichen, monatlichen oder jährlichen Daten in R zusammenfassen.
In diesem Tutorial wird erklärt, wie dies mit den Paketen lubridate und dplyr einfach möglich …
Oft möchten Sie eine Zeitreihe in R zeichnen, um zu visualisieren, wie sich die Werte der Zeitreihen im Laufe der Zeit ändern.
In diesem Tutorial wird erklärt, wie Sie dies …
Es gibt zwei Möglichkeiten, das Jahr schnell aus einem Datum in R zu extrahieren:
Methode 1: Verwenden Sie format()
df$year <- format(as.Date(df$date, format="%d/%m/%Y …
Die mittlere absolute Abweichung misst die Streuung der Beobachtungen in einem Datensatz.
Dies ist eine besonders nützliche Metrik, da sie weniger von Ausreißern betroffen ist als andere Streuungsmaße wie Standardabweichung …
Der mittlere absolute prozentuale Fehler (MAPE, engl. mean absolute percentage error) ist eine Metrik, die angibt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einer Regressionsanalyse im Durchschnitt …
Der mittlere quadratische Fehler (MSE, engl. mean squared error) ist eine Metrik, die angibt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einer Regressionsanalyse im Durchschnitt entfernt sind …
Die Autokorrelation misst den Ähnlichkeitsgrad zwischen einer Zeitreihe und einer verzögerten Version von sich selbst über aufeinanderfolgende Zeitintervalle.
Es wird manchmal auch als "serielle Korrelation" oder "verzögerte Korrelation" bezeichnet, da …
Eine der am häufigsten verwendeten Metriken zur Messung der Vorhersagegenauigkeit eines Modells ist MSE, was für Mean Squared Error steht. Es wird berechnet als:
MSE = (1 / n) * Σ (Ist – Vorhersage …
Der Root Mean Square Error (RMSE) ist eine Metrik, die angibt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einer Regressionsanalyse im Durchschnitt entfernt sind. Es wird berechnet …
Eine der am häufigsten verwendeten Metriken zur Messung der Prognosegenauigkeit eines Modells ist MSE, was für Mean Squared Error steht. Es wird berechnet als:
MSE = (1 / n) * Σ (Ist – Prognose …
Die exponentielle Glättung ist eine Technik zum „Glätten“ von Zeitreihendaten und wird häufig für kurzfristige Prognosen verwendet.
Die Grundidee ist, dass Zeitreihendaten häufig mit „zufälligem Rauschen“ verbunden sind, was zu …
Ein gewichteter gleitender Durchschnitt ist eine Technik, mit der Zeitreihendaten geglättet werden können, um das „Rauschen“ in den Daten zu reduzieren und Muster und Trends leichter zu identifizieren.
Die ganze …
Ein gleitender Durchschnitt ist eine Technik, mit der Zeitreihendaten geglättet werden können, um das „Rauschen“ in den Daten zu reduzieren und Muster und Trends leichter zu identifizieren.
Die ganze Idee …
In der Statistik ist die Regressionsanalyse eine Technik, mit der wir die Beziehung zwischen einer Prädiktorvariablen x und einer Antwortvariablen y verstehen.
Wenn wir eine Regressionsanalyse durchführen, erhalten wir ein …
Der Ljung-Box-Test, benannt nach den Statistikern Greta M. Ljung und George EP Box, ist ein statistischer Test, der prüft, ob in einer Zeitreihe eine Autokorrelation vorliegt.
Der Ljung-Box-Test wird häufig …
Der mittlere quadratische Fehler (engl. Mean Squared Error = MSE) ist eine übliche Methode zur Messung der Vorhersagegenauigkeit eines Modells. Es wird berechnet als:
MSE = (1 / n) * Σ (Ist – Vorhersage) 2 …
Eine der am häufigsten verwendeten Metriken zur Messung der Prognosegenauigkeit eines Modells ist MAPE, was für den mittleren absoluten prozentualen Fehler steht.
Die Formel zur Berechnung der MAPE lautet wie …
Die mittlere absolute Abweichung (engl. MAD – Mean Absolute Deviation) ist eine Möglichkeit, die Streuung für einen Satz von Datenwerten zu messen.
Ein niedriger Wert für die mittlere …
Eine der am häufigsten verwendeten Metriken zur Messung der Prognosegenauigkeit eines Modells ist MAPE, was für den mittleren absoluten prozentualen Fehler (Mean Absolute Percentage Error) steht …
"Statistik in Excel leicht gemacht" ist eine Sammlung von 16 Excel-Tabellen, die integrierte Formeln enthalten, um die wichtigsten statistischen Tests und Funktionen durchzuführen.
Statologie ist eine Website, die das Erlernen von Statistik erleichtert. Wir bei Statologie glauben, dass Statistik ein unglaublich nützliches Feld ist, viele aber von den verwirrenden Notationen und komplizierten Formeln eingeschüchtert werden.
Aus diesem Grund widmen wir uns dem Unterrichten auf einfache und unkomplizierte Weise - anhand von Beispielen, Abbildungen und Praxisnähe können wir Konzepte auf eine Weise erklären, die tatsächlich Sinn macht.