Durch "Zeitliche Zerlegung" und "Prognose" wird ein Zeitseriendiagramm in die Komponenten "Trend", "Saisonal" und "Rest" aufgeteilt.
"Zeitliche Zerlegung" und "Prognose" wenden die Methode Saison-Trend-Zerlegung mittels LOESS (STL) an, um die Komponenten der Zeitserie zu berechnen.
Beispiel
Eine Umweltorganisation untersucht Änderungen der Luftqualität im Zeitverlauf. Mit "Zeitliche Zerlegung" kann bestimmt werden, wie sich saisonale Schwankungen auf die Luftqualität auswirken und ob sich die Luftqualität im Laufe der Zeit verbessert oder verschlechtert. Mit "Prognose" können zukünftige Luftqualitätswerte vorhergesagt werden.
Verwenden der Funktion "Zeitliche Zerlegung"
Gehen zum Ausführen der Analysefunktion "Zeitliche Zerlegung" folgendermaßen vor:
- Erstellen Sie eine Karte, ein Diagramm oder eine Tabelle anhand des Datasets, mit dem Sie eine zeitliche Zerlegung durchführen möchten.
- Klicken Sie auf die Schaltfläche Aktion .
- Führen Sie einen der folgenden Vorgänge aus:
- Wenn es sich bei der Kachel um ein Zeitseriendiagramm handelt, bleiben Sie auf der Registerkarte Zeitliche Analyse.
- Wenn es sich bei der Kachel um einen anderen Diagrammtyp oder eine Tabelle handelt, klicken Sie im Bereich Analyse auf Wie hat es sich verändert?.
- Ist die Kachel eine Karte, klicken Sie auf die Registerkarte Antworten suchen und dann auf Wie hat es sich verändert?.
- Klicken Sie auf Zeitliche Zerlegung.
- Wählen Sie für Layer auswählen das Dataset aus, mit dem Sie eine zeitliche Zerlegung durchführen möchten.
- Wählen Sie für Datums-/Zeitfeld auswählen das Datums-/Uhrzeitfeld aus, das Sie für die Zeitachse verwenden möchten.
- Blenden Sie Zusätzliche Optionen ein, und geben Sie Werte für die Parameter Zahlenfeld auswählen, Saisonale Schwankungen bereinigen und Fenstergröße auswählen ein, falls erforderlich. Weitere Informationen finden Sie in den Verwendungshinweisen.
- Sie können Prognose anzeigen auswählen, um Prognosewerte auf der Zeitachse einzubeziehen. Wenn Prognose anzeigen ausgewählt ist, können Sie den Parameter Zyklen für Prognosehorizont festlegen anpassen, um festzulegen, wie viele Zyklen in die Prognose einbezogen werden. Die Standardanzahl von Zyklen beträgt zwei.
- Klicken Sie auf Ausführen.
Verwenden der Funktion "Prognose"
Gehen Sie zum Ausführen der Analysefunktion "Prognose" folgendermaßen vor:
- Erstellen Sie eine Karte, ein Diagramm oder eine Tabelle anhand des Datasets, mit dem Sie eine zeitliche Zerlegung durchführen möchten.
- Klicken Sie auf die Schaltfläche Aktion .
- Führen Sie einen der folgenden Vorgänge aus:
- Wenn es sich bei der Kachel um ein Zeitseriendiagramm handelt, bleiben Sie auf der Registerkarte Zeitliche Analyse.
- Wenn es sich bei der Kachel um einen anderen Diagrammtyp oder eine Tabelle handelt, klicken Sie im Bereich Analyse auf Wie hat es sich verändert?.
- Ist die Kachel eine Karte, klicken Sie auf die Registerkarte Antworten suchen und dann auf Wie hat es sich verändert?.
- Klicken Sie auf Prognose.
- Wählen Sie für Layer auswählen das Dataset aus, mit dem Sie Prognosen ausführen möchten.
- Wählen Sie für Datums-/Zeitfeld auswählen das Datums-/Uhrzeitfeld aus, das Sie für die Zeitachse verwenden möchten.
- Blenden Sie Zusätzliche Optionen ein, und geben Sie Werte für die Parameter Zahlenfeld auswählen, Saisonale Schwankungen bereinigen und Fenstergröße auswählen ein, falls erforderlich. Weitere Informationen finden Sie in den Verwendungshinweisen.
- Passen Sie den Parameter Zyklen für Prognosehorizont festlegen an, um festzulegen, wie viele Zyklen in die Prognose einbezogen werden. Die Standardanzahl von Zyklen beträgt zwei.
- Klicken Sie auf Ausführen.
Verwendungshinweise
Sie finden "Zeitliche Zerlegung" und "Prognose" mit der Schaltfläche Aktion unter Wie hat es sich verändert? auf der Registerkarte Antworten suchen oder auf der Registerkarte Zeitliche Analyse in einem Zeitseriendiagramm. Die Eingabe muss ein Dataset sein, das ein Datums-/Uhrzeitfeld enthält, und Daten von mindestens einem Jahr aufweisen. Weitere Informationen finden Sie unter Funktionsweise von "Zeitliche Zerlegung" und "Prognose".
Wählen Sie mit dem Parameter Datums-/Zeitfeld auswählen das Datums-/Uhrzeitfeld aus, auf das die zeitliche Zerlegung angewendet werden soll.
Blenden Sie Zusätzliche Optionen ein, um die Parameter Zahlenfeld auswählen, Saisonale Schwankungen bereinigen und Fenstergröße auswählen anzuzeigen. In der folgenden Tabelle werden diese Parameter zusammen mit ihren Standardwerten zusammengefasst:
Parameter | Beschreibung | Standardwert |
---|---|---|
Zahlenfeld auswählen | Ein Feld, in dem der Wert jeder Beobachtung in der Zeitserie angegeben wird. Wenn Sie zum Beispiel eine Zeitserie durchschnittlicher globaler Temperaturen zerlegen, verwenden Sie für den Parameter Zahlenfeld auswählen das Feld "Temperatur". | Kein. Der Wert für jeden Punkt basiert auf der Anzahl. |
Saisonale Schwankungen bereinigen | Mithilfe der saisonalen Schwankungen wird bestimmt, wie die Komponente "Saisonal" berechnet wird. Die folgenden Optionen für saisonale Schwankungen sind verfügbar:
| Kein. Die geeigneten saisonalen Schwankungen werden anhand der Daten ausgewählt. |
Fenstergröße auswählen | Die Fenstergröße bestimmt den Prozentsatz der bei der Glättungsberechnung verwendeten Datenpunkte. | 50 % |
Wählen Sie für "Zeitliche Zerlegung" Prognose anzeigen aus, um eine Ausgabezeitserie zu erstellen, in der prognostizierte zukünftige Werte auf der Komponente "Saisonal" und der Komponente "Saisonal bereinigt" basieren. Die Anzahl der Zyklen in der Prognose basiert auf dem Parameter Zyklen für Prognosehorizont festlegen. Der Standardwert ist 2. Der Parameter Prognose anzeigen ist für "Prognose" nicht verfügbar, da er immer aktiviert ist.
Die Ergebnisse für "Zeitliche Zerlegung" und "Prognose" enthalten zwei Datasets: eines mit der Bezeichnung STL und eines mit der Bezeichnung Forecast - STL (für "Zeitliche Zerlegung" nur enthalten, wenn Prognose anzeigen aktiviert ist).
Das Dataset STL enthält Felder für die Rohdaten (auf Grundlage der Anzahl oder des Zahlenfeldes, die bzw. das zum Zerlegen der Zeitserie verwendet wurde), vier Komponenten ("Saisonal", "Trend", "Rest" und "Saisonal bereinigt") sowie das ursprüngliche Datums-/Uhrzeitfeld.
Das Dataset Forecast - STL enthält das ursprüngliche Datums-/Uhrzeitfeld sowie Felder für die Rohdaten (auf Grundlage der Anzahl oder des Zahlenfeldes, die bzw. das zum Zerlegen der Zeitserie verwendet wurde), eine Schätzung und das obere und untere Prognoseintervall (80 % und 95 %).
Funktionsweise von "Zeitliche Zerlegung" und "Prognose"
Für "Zeitliche Zerlegung" und "Prognose" wird die STL-Methode verwendet, um eine Zeitserie in ihre Komponenten "Saisonal", "Trend" und "Rest" zu zerlegen. Die Datenanforderungen im STL-Algorithmus basieren auf den saisonalen Schwankungen, die zum Beschreiben der Komponente "Saisonal" verwendet werden.
Saisonale Schwankungen
Bei der STL-Methode werden saisonale Schwankungen (auch als Periodizität bezeichnet) verwendet, um saisonale Auswirkungen in einer Zeitserie auszugleichen. Beispielsweise folgt die Luftqualität häufig einem jährlichen Zyklus, mit besserer Luftqualität in den Wintermonaten und schlechterer Luftqualität in den Sommermonaten. Deshalb können Luftqualitätsdaten mittels monatlicher saisonaler Schwankungen zerlegt werden, um die Zeitserie an den Zyklus besserer und schlechterer Luftqualität anzupassen und so den Gesamttrend der Luftqualität im Zeitverlauf besser abbilden zu können.
Saisonale Schwankungen können wöchentlich, monatlich, vierteljährlich oder jährlich sein. Die Datenanforderungen für "Zeitliche Zerlegung" und "Prognose" hängen davon ab, welche saisonalen Schwankungen verwendet werden.
Bei allen Optionen für saisonale Schwankungen werden die Daten in Teilserien unterteilt. Um "Zeitliche Zerlegung" oder "Prognose" verwenden zu können, muss jede Teilserie mindestens einmal im Dataset vorhanden sein.
Die folgende Tabelle bietet einen Überblick über die Optionen für saisonale Schwankungen sowie die jeweiligen Teilserien und Datenanforderungen.
Saisonale Schwankungen | Teilserie | Datenanforderungen |
---|---|---|
Wöchentlich | Woche 1 bis 52 Beispiel: 1. Januar bis 7. Januar ist Woche 1, 8. Januar bis 14. Januar ist Woche 2 usw. | Die Daten von mindestens 52 Wochen mit mindestens einem Datenpunkt pro Woche. |
Monatlich | Die Monate Januar bis Dezember. | Die Daten von mindestens 12 Monaten mit mindestens einem Datenpunkt pro Monat. |
Vierteljährlich | Quartal 1 bis 4. | Die Daten von mindestens vier Quartalen mit mindestens einem Datenpunkt pro Quartal. |
Jährlich | Einzelne Jahre. Wenn das Dataset z. B. Daten von 2015 bis 2020 enthält, lauten die Teilserien 2015, 2016, 2017, 2018, 2019 und 2020. | Die Daten von mindestens vier Jahren mit mindestens einem Datenpunkt pro Jahr. |
Beispiel
Sie möchten "Zeitliche Zerlegung" und "Prognose" mit saisonalen Schwankungen für ein Dataset anwenden, das Daten enthält, die von Januar 2015 bis Dezember 2020 täglich gesammelt wurden. Das System zum Sammeln der Daten wird jedoch jährlich vom 1. Januar bis 10. Januar für Aktualisierungen und Wartung heruntergefahren, sodass in diesem Zeitraum keine Daten gesammelt werden. Für die Verwendung wöchentlicher saisonaler Schwankungen müssen die Daten mindestens ein Datenvorkommen pro Woche enthalten. Da die Daten von Woche 1 (1. Januar bis 7. Januar) vollständig fehlen, können Sie für das Dataset keine wöchentlichen saisonalen Schwankungen verwenden. Alle anderen Optionen für saisonale Schwankungen sind mit dem Dataset kompatibel, da es die Mindestanforderungen an die Daten erfüllt und mindestens ein Vorkommen für die monatliche, vierteljährliche, und jährliche Teilserie aufweist.
Damit das Dataset mit wöchentlichen saisonalen Schwankungen kompatibel ist, wird der Zeitpunkt für das geplante Herunterfahren ab 2021 in 2. Januar geändert. Die am 1. Januar 2021 gesammelten Daten gehören zur Teilserie Woche 1. Somit enthält das Dataset jetzt mindestens einen Datenpunkt für jede Teilserie.
Hinweis:
Die Anforderung, dass ein Datenpunkt pro Zeitserie vorhanden sein muss, ist eine allgemeine Anforderung, die nicht nur für einzelne Jahre gilt. Deshalb erfüllt der Datenpunkt 2. Januar 2021 die Anforderung, obwohl von 2015 bis 2020 keine Daten für Woche 1 verfügbar sind.
Vorhersageintervalle
Vorhersageintervalle werden mit der Funktion "Prognose" unter Verwendung der folgenden Gleichung von Hyndman und Athanasopoulos (2018, Kap. 7) berechnet:
ŷT+h|T ± cσh
Wobei gilt:
- ŷt = Durchschnittswert der Prognoseverteilung zum Zeitpunkt t
- ŷT+h|T = kumulative Prognose von ŷt bis zum Zeitpunkt T für h Prognosehorizontzyklen
- c = Überdeckungswahrscheinlichkeit
- σh = Quadratwurzel der Prognosevarianz
Einschränkungen
In "Zeitliche Zerlegung" und "Prognose" werden Felder mit reinem Uhrzeitwert (also Datums-/Zeitfelder mit einer Zeitkomponente, jedoch ohne Datumsangaben) nicht unterstützt.
Referenzen
Hyndman, Rob J. und George Athanasopoulos. 2018. Forecasting: Principles and Practice. 2. Aufl. Melbourne, Australien: OTexts. OTexts.com/fpp2.