Verwenden von Zeitliche Zerlegung und Prognose

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Durch "Zeitliche Zerlegung" und "Prognose" wird ein Zeitseriendiagramm in die Komponenten "Trend", "Saisonal" und "Rest" aufgeteilt.

"Zeitliche Zerlegung" und "Prognose" wenden die Methode Saison-Trend-Zerlegung mittels LOESS (STL) an, um die Komponenten der Zeitserie zu berechnen.

Beispiel

Eine Umweltorganisation untersucht Änderungen der Luftqualität im Zeitverlauf. Mit "Zeitliche Zerlegung" können die Mitarbeitenden bestimmen, wie sich saisonale Schwankungen auf die Luftqualität auswirken und ob sich die Luftqualität im Laufe der Zeit verbessert oder verschlechtert. Mit "Prognose" können sie zukünftige Luftqualitätswerte vorhersagen.

Ausführen von "Zeitliche Zerlegung"

Gehen Sie zum Durchführen einer zeitlichen Zerlegung folgendermaßen vor:

  1. Erstellen Sie eine Karte, ein Diagramm oder eine Tabelle anhand des Datasets, mit dem Sie eine zeitliche Zerlegung durchführen möchten.
  2. Klicken Sie auf die Schaltfläche Aktion Aktion.
  3. Führen Sie einen der folgenden Vorgänge aus:
    • Wenn es sich um eine Zeitseriendiagramm-Kachel handelt, bleiben Sie auf der Registerkarte Zeitliche Analyse.
    • Wenn es sich um einen anderen Typ von Diagramm-Kachel oder eine Tabellen-Kachel handelt, klicken Sie im Bereich Analyse auf Wie hat es sich verändert?.
    • Für eine Karten-Kachel klicken Sie auf die Registerkarte Antworten suchen und dann auf Wie hat es sich verändert?.
  4. Klicken Sie auf Zeitliche Zerlegung.
  5. Wählen Sie unter Layer auswählen das Dataset für die zeitliche Zerlegung aus.
  6. Wählen Sie für Datums-/Zeitfeld auswählen das Datums-/Uhrzeitfeld aus, das für die Zeitachse verwendet werden soll.
  7. Blenden Sie Zusätzliche Optionen ein, und geben Sie Werte für die Parameter Zahlenfeld auswählen, Saisonale Schwankungen bereinigen und Fenstergröße auswählen an, falls erforderlich.

    Weitere Informationen finden Sie im nachstehenden Abschnitt "Verwendungshinweise".

  8. Sie können Prognose anzeigen auswählen, um Prognosewerte auf der Zeitachse einzubeziehen.

    Wenn Prognose anzeigen ausgewählt ist, können Sie den Parameter Zyklen für Prognosehorizont festlegen anpassen, um anzugeben, wie viele Zyklen in die Prognose einbezogen werden. Die Standardanzahl von Zyklen beträgt 2.

  9. Klicken Sie auf Ausführen.

Ausführen der Funktion "Prognose"

Gehen Sie zum Durchführen einer Prognose folgendermaßen vor:

  1. Erstellen Sie eine Karte, ein Diagramm oder eine Tabelle anhand des Datasets, mit dem Sie eine Prognose durchführen möchten.
  2. Klicken Sie auf die Schaltfläche Aktion Aktion.
  3. Führen Sie einen der folgenden Vorgänge aus:
    • Wenn es sich um eine Zeitseriendiagramm-Kachel handelt, bleiben Sie auf der Registerkarte Zeitliche Analyse.
    • Wenn es sich um einen anderen Typ von Diagramm-Kachel oder eine Tabellen-Kachel handelt, klicken Sie im Bereich Analyse auf Wie hat es sich verändert?.
    • Für eine Karten-Kachel klicken Sie auf die Registerkarte Antworten suchen und dann auf Wie hat es sich verändert?.
  4. Klicken Sie auf Prognose.
  5. Wählen Sie unter Layer auswählen das Dataset für die Prognose aus.
  6. Wählen Sie für Datums-/Zeitfeld auswählen das Datums-/Uhrzeitfeld aus, das für die Zeitachse verwendet werden soll.
  7. Blenden Sie Zusätzliche Optionen ein, und geben Sie Werte für die Parameter Zahlenfeld auswählen, Saisonale Schwankungen bereinigen und Fenstergröße auswählen an, falls erforderlich.

    Weitere Informationen finden Sie im nachstehenden Abschnitt "Verwendungshinweise".

  8. Passen Sie den Wert im Parameter Zyklen für Prognosehorizont festlegen an, um festzulegen, wie viele Zyklen in die Prognose einbezogen werden.

    Die Standardanzahl von Zyklen beträgt 2.

  9. Klicken Sie auf Ausführen.

Verwendungshinweise

"Zeitliche Zerlegung" und "Prognose" rufen Sie mit der Schaltfläche Aktion Aktion unter Wie hat es sich verändert? auf der Registerkarte Antworten suchen oder auf der Registerkarte Zeitliche Analyse in einem Zeitseriendiagramm auf. Die Eingabe muss ein Dataset sein, das ein Datums-/Uhrzeitfeld enthält, und Daten von mindestens einem Jahr aufweisen. Weitere Informationen finden Sie unten im Abschnitt "Funktionsweise von 'Zeitliche Zerlegung' und 'Prognose'".

Wählen Sie mit dem Parameter Datums-/Zeitfeld auswählen das Datums-/Uhrzeitfeld aus, auf das die zeitliche Zerlegung angewendet werden soll.

Blenden Sie Zusätzliche Optionen ein, um die Parameter Zahlenfeld auswählen, Saisonale Schwankungen bereinigen und Fenstergröße auswählen anzuzeigen. In der folgenden Tabelle werden diese Parameter zusammen mit ihren Standardwerten zusammengefasst:

ParameterBeschreibungStandardwert
Zahlenfeld auswählen

Ein Feld, in dem der Wert jeder Beobachtung in der Zeitserie angegeben wird. Wenn Sie zum Beispiel eine Zeitserie durchschnittlicher globaler Temperaturen zerlegen, verwenden Sie für den Parameter Zahlenfeld auswählen das Feld "Temperatur".

Kein. Der Wert für jeden Punkt basiert auf der Anzahl.

Saisonale Schwankungen bereinigen

Mithilfe von saisonalen Schwankungen wird bestimmt, wie die Komponente "Saisonal" berechnet wird.

Die folgenden Optionen für saisonale Schwankungen sind verfügbar:

  • Wöchentlich
  • Monatlich
  • Vierteljährlich
  • Jährlich

Kein. Wählen Sie auf Grundlage der Daten geeignete saisonale Schwankungen aus.

Fenstergröße auswählen

Die Fenstergröße bestimmt den Prozentsatz der bei der Glättungsberechnung verwendeten Datenpunkte.

50 %

Wählen Sie für "Zeitliche Zerlegung" Prognose anzeigen aus, um eine Ausgabezeitserie zu erstellen, in der prognostizierte zukünftige Werte auf der Komponente "Saisonal" und der Komponente "Saisonal bereinigt" basieren. Die Anzahl der Zyklen in der Prognose basiert auf dem Parameter Zyklen für Prognosehorizont festlegen. Der Standardwert ist 2. Der Parameter Prognose anzeigen ist für "Prognose" nicht verfügbar, da er immer aktiviert ist.

Die Ergebnisse für "Zeitliche Zerlegung" und "Prognose" enthalten zwei Datasets: das Dataset "STL" und das Dataset "Forecast - STL" (für "Zeitliche Zerlegung" nur enthalten, wenn Prognose anzeigen aktiviert ist).

Das Dataset "STL" enthält Felder für die Rohdaten (auf Grundlage der Anzahl oder des Zahlenfeldes, die bzw. das zum Zerlegen der Zeitserie verwendet wurde), vier Komponenten ("Saisonal", "Trend", "Rest" und "Saisonal bereinigt") sowie das ursprüngliche Datums-/Uhrzeitfeld.

Das Dataset "Forecast - STL" enthält das ursprüngliche Datums-/Uhrzeitfeld sowie Felder für die Rohdaten (auf Grundlage der Anzahl oder des Zahlenfeldes, die bzw. das zum Zerlegen der Zeitserie verwendet wurde), eine Schätzung und das obere und untere Prognoseintervall (80 % und 95 %).

Funktionsweise von "Zeitliche Zerlegung" und "Prognose"

Für "Zeitliche Zerlegung" und "Prognose" wird die STL-Methode verwendet, um eine Zeitserie in ihre Komponenten "Saisonal", "Trend" und "Rest" zu zerlegen. Die Datenanforderungen im STL-Algorithmus basieren auf den saisonalen Schwankungen, die zum Beschreiben der Komponente "Saisonal" verwendet werden.

Saisonale Schwankungen

Bei der STL-Methode werden saisonale Schwankungen (auch als Periodizität bezeichnet) verwendet, um saisonale Auswirkungen in einer Zeitserie auszugleichen. Beispielsweise folgt die Luftqualität häufig einem jährlichen Zyklus, mit besserer Luftqualität in den Wintermonaten und schlechterer Luftqualität in den Sommermonaten. Luftqualitätsdaten können mittels monatlicher saisonaler Schwankungen zerlegt werden, um die Zeitserie an den Zyklus besserer und schlechterer Luftqualität anzupassen und so den Gesamttrend der Luftqualität im Zeitverlauf besser abbilden zu können.

Saisonale Schwankungen können wöchentlich, monatlich, vierteljährlich oder jährlich sein. Die Datenanforderungen für "Zeitliche Zerlegung" und "Prognose" hängen von den verwendeten saisonalen Schwankungen ab.

Bei allen Optionen für saisonale Schwankungen werden die Daten in Teilserien unterteilt. Um "Zeitliche Zerlegung" oder "Prognose" verwenden zu können, muss jede Teilserie mindestens einmal im Dataset vorhanden sein.

Die folgende Tabelle bietet einen Überblick über die Optionen für saisonale Schwankungen sowie die jeweiligen Teilserien und Datenanforderungen:

Saisonale SchwankungenTeilserieDatenanforderungen

Wöchentlich

Woche 1 bis 52 Beispiel: 1. Januar bis 7. Januar ist Woche 1, 8. Januar bis 14. Januar ist Woche 2 usw.

Die Daten von mindestens 52 Wochen mit mindestens einem Datenpunkt pro Woche.

Monatlich

Die Monate Januar bis Dezember.

Die Daten von mindestens 12 Monaten mit mindestens einem Datenpunkt pro Monat.

Vierteljährlich

Quartal 1 bis 4.

Die Daten von mindestens vier Quartalen mit mindestens einem Datenpunkt pro Quartal.

Jährlich

Einzelne Jahre. Wenn das Dataset z. B. Daten von 2015 bis 2020 enthält, lauten die Teilserien 2015, 2016, 2017, 2018, 2019 und 2020.

Die Daten von mindestens vier Jahren mit mindestens einem Datenpunkt pro Jahr.

Beispiel für saisonale Schwankungen

Sie möchten "Zeitliche Zerlegung" und "Prognose" mit saisonalen Schwankungen für ein Dataset anwenden, das Daten enthält, die von Januar 2015 bis Dezember 2020 täglich gesammelt wurden. Das System zum Sammeln der Daten wird jedoch jährlich vom 1. Januar bis 10. Januar für Aktualisierungen und Wartung heruntergefahren, sodass in diesem Zeitraum keine Daten gesammelt werden. Für die Verwendung wöchentlicher saisonaler Schwankungen müssen die Daten mindestens ein Datenvorkommen pro Woche enthalten. Da die Daten von Woche 1 (1. Januar bis 7. Januar) vollständig fehlen, können Sie für das Dataset keine wöchentlichen saisonalen Schwankungen verwenden. Alle anderen Optionen für saisonale Schwankungen sind mit dem Dataset kompatibel, da es die Mindestanforderungen an die Daten erfüllt und mindestens ein Vorkommen für die monatliche, vierteljährliche, und jährliche Teilserie aufweist.

Damit das Dataset mit wöchentlichen saisonalen Schwankungen kompatibel ist, wird der Zeitpunkt für das geplante Herunterfahren ab 2021 in 2. Januar geändert. Die am 1. Januar 2021 gesammelten Daten gehören zur Teilserie Woche 1. Somit enthält das Dataset jetzt mindestens einen Datenpunkt für jede Teilserie.

Hinweis:

Die Anforderung, dass ein Datenpunkt pro Zeitserie vorhanden sein muss, ist eine allgemeine Anforderung, die nicht nur für einzelne Jahre gilt. Deshalb erfüllt der Datenpunkt 2. Januar 2021 die Anforderung, obwohl von 2015 bis 2020 keine Daten für Woche 1 verfügbar sind.

Vorhersageintervalle

Vorhersageintervalle werden in der Funktion "Prognose" unter Verwendung der folgenden Gleichung von Hyndman und Athanasopoulos (2018, Kap. 7) berechnet:

ŷT+h|T ± cσh

Wobei gilt:

  • ŷt = Durchschnittswert der Prognoseverteilung zum Zeitpunkt t
  • ŷT+h|T = kumulative Prognose von ŷt bis zum Zeitpunkt T für h Prognosehorizontzyklen
  • c = Überdeckungswahrscheinlichkeit
  • σh = Quadratwurzel der Prognosevarianz

Einschränkungen

In "Zeitliche Zerlegung" und "Prognose" werden Felder mit reinem Uhrzeitwert (Datums-/Zeitfelder mit einer Zeitkomponente, jedoch ohne Datumsangaben) nicht unterstützt.

Referenzen

Hyndman, Rob J. und George Athanasopoulos. 2018. Forecasting: Principles and Practice. 2. Aufl. Melbourne, Australien: OTexts. OTexts.com/fpp2.