Das Werkzeug "Pivot" konvertiert ein Dataset im Long-Format in ein Dataset im Wide-Format und verwendet dazu eindeutige Werte aus einem vorhandenen Feld, um neue Felder zu erstellen.
Beispiele
Das Werkzeug "Pivot" kann unter anderem in folgenden Szenarien verwendet werden:
- Sie haben ein Dataset im Long-Format mit vielen Datensätzen und wenigen Feldern und möchten es so formatieren, dass es wenige Datensätze und viele Felder enthält.
- Sie haben ein Dataset, das Datensätze aus Feldbeobachtungen für mehrere Jahre enthält, und möchten die Werte nach Jahren zusammenfassen.
Parameter
In der folgenden Tabelle werden die Parameter im Werkzeug "Pivot" beschrieben:
Parameter | Beschreibung |
---|---|
Eingabe-Dataset | Das zu pivotierende Dataset. |
Eingabefelder | Ein oder mehrere Felder, mit denen die eindeutigen Datensätze im Ausgabe-Dataset definiert werden. Datensätze mit übereinstimmenden Werten werden mit den Aggregatfunktionen aggregiert. |
Pivot-Feld | Das Feld mit den Werten, die in neue Werte im Ausgabe-Dataset transformiert werden. |
Wertefeld | Das Feld, das zur Bestimmung der Werte der neuen Datensätze verwendet wird. |
Aggregatfunktionen | Die Funktion oder Funktionen für das Berechnen der neuen Werte. |
Verwendungshinweise
Verwenden Sie den Parameter Eingabe-Dataset, um das zu pivotierende Dataset zu identifizieren.
Verwenden Sie den Parameter Eingabefelder, um ein oder mehrere Felder mit Werten zu identifizieren, nach denen gruppiert werden soll. Die Einzelwerte aus dem angegebenen Feld bzw. den angegebenen Feldern werden zu den Datensätzen im Ausgabe-Dataset. Es kann nicht dasselbe Feld sowohl für Eingabefelder als auch für Pivot-Feld oder Wertefeld angegeben werden.
Verwenden Sie den Parameter Pivot-Feld, um das Feld zu identifizieren, das die Werte enthält, die zur Erstellung der neuen Feldnamen im Ausgabe-Dataset verwendet werden.
Mit dem Parameter Aggregatfunktionen wird bestimmt, wie die Werte aus den gruppierten Datensätzen berechnet werden. Die folgenden Aggregatfunktionen sind verfügbar:
- Summe: Die Summe der numerischen Werte in einem Feld. Die Summe von [null, 1, 3] ist 4.
- Min: Der Minimalwert eines numerischen Feldes oder Datumsfeldes. Das Minimum von [0, 2, null] ist 0.
- Max: Der Maximalwert eines numerischen Feldes oder Datumsfeldes. Das Maximum von [0, 2, null] ist 2.
- Mittelwert: Der Mittelwert der numerischen Werte. Der Mittelwert von [0, 2, null] ist 1.
- Standardabweichung: Die Standardabweichung eines numerischen Feldes. Die Standardabweichung von [null, 1, 1, 1] ist 0.
- Anzahl: Die Anzahl der Nicht-NULL-Werte. Kann für ein Feld jedes beliebigen Typs verwendet werden. Die Anzahl von [null, "hello", "world"] ist 2.
- Beliebig: Dies ist ein Beispielwert aus einem Feld eines beliebigen Typs.
Ausgaben
Die Ausgabe des Werkzeugs ist ein Dataset mit den folgenden Feldern und Werten:
- Alle Felder, die über den Parameter Eingabefelder angegeben wurden. Die Ausgabe enthält einen Datensatz pro Einzelwert, der in dem Feld oder der Kombination von Feldern gefunden wurde.
- Neue Felder für jeden Einzelwert in dem mit dem Parameter Pivot-Feld angegebenen Feld. Diese Felder enthalten aggregierte Werte aus dem mit dem Parameter Wertefeld angegebenen Feld. Wenn das Pivot-Feld beispielsweise zwei Einzelwerte enthält, California und Washington, und Sie die Aggregatfunktionen Mittelwert und Beliebig berechnen, enthält das Ergebnis vier neue Felder: MEAN_California, ANY_California, MEAN_Washington und ANY_Washington.
Wenn das Pivot-Feld NULL-Werte enthält, wird ein Feld mit dem Namen null hinzugefügt. Wenn das Pivot-Feld leere Werte enthält, wird ein Feld mit dem Namen _ hinzugefügt.
Einschränkungen
Für das Werkzeug "Pivot" sind die folgenden Einschränkungen bekannt:
- Bei Feldnamen wird die Groß-/Kleinschreibung nicht beachtet. Wenn der Parameter Pivot-Feld übereinstimmende Textwerte mit unterschiedlicher Groß- und Kleinschreibung enthält, werden die Ausgabefelder umbenannt, um Duplikate zu vermeiden.
- Feldnamen, die ungültige Zeichen enthalten oder mit einer Zahl beginnen, werden umbenannt. Wenn der Parameter Pivot-Feld mehrere Werte enthält, für die sich bei einer Umbenennung ein Konflikt ergeben würde, werden diese automatisch umbenannt, um Duplikate zu vermeiden.
- Für den Parameter Pivot-Feld werden maximal 1.000 unterschiedliche Werte unterstützt. Wenn mehr als 1.000 unterschiedliche Werte gefunden werden, wird ein Fehler ausgegeben.
- Pivot erfordert eine Überprüfung des gesamten Eingabe-Datasets, um die neuen Feldwerte zu bestimmen. Wenn die Performance anschließender Werkzeuge ein Problem darstellt, sollten Sie die Größe des Eingabe-Datasets begrenzen.
Lizenzanforderungen
Die folgenden Lizenzen und Konfigurationen werden benötigt:
- Benutzertyp Creator oder Professional
- Publisher-, Vermittler- oder Administratorrolle oder eine entsprechende benutzerdefinierte Rolle
Weitere Informationen zu den Anforderungen für Data Pipelines finden Sie unter Anforderungen.