Mit dem Werkzeug Attribute zusammenfassen werden Datensätze zusammengefasst und Statistiken berechnet. Sie können alle Datensätze aggregieren oder die Aggregation basierend auf übereinstimmenden Werten aus einem oder mehreren Feldern durchführen.
Beispiele
Das Werkzeug Attribute zusammenfassen kann beispielsweise in den folgenden Szenarien verwendet werden:
- Aggregieren aller Verkaufsdatensätze zur Berechnung des Gesamtgewinns
- Aggregieren von Verkaufsdatensätzen basierend auf dem Artikeltyp zur Berechnung des Gewinns nach Artikel
Parameter
In der folgenden Tabelle werden die Parameter beschrieben, die im Werkzeug Attribute zusammenfassen verwendet werden:
Parameter | Beschreibung |
---|---|
Eingabe-Dataset | Das Dataset mit den Datensätzen, die zusammengefasst werden sollen. |
Abzugleichende Felder | Mindestens ein Feld, über das Datensätze basierend auf übereinstimmenden Werten aggregiert werden. Dieser Parameter ist optional. Standardmäßig werden alle Datensätze zusammengefasst. |
Zusammenfassungsfelder | Die Felder des Eingabe-Datasets, die zusammengefasst werden, und die Statistiken, die für jedes Feld berechnet werden. Dieser Parameter ist optional. Standardmäßig wird die Statistik COUNT zurückgegeben. |
Verwendungshinweise
Verwenden Sie den Parameter Eingabe-Dataset, um das Dataset zu identifizieren, das die Datensätze enthält, die zusammengeführt werden sollen.
Verwenden Sie den Parameter Abzugleichende Felder, um ein oder mehrere Felder mit den Werten anzugeben, nach denen die Eingabedatensätze gruppiert werden sollen. Wenn Sie nach Feldern zusammenfassen, wird die Statistik für jede eindeutige Kombination aus Attributwerten berechnet. Wenn keine Felder angegeben werden, werden die Statistiken anhand aller Datensätze berechnet.
Verwenden Sie den Parameter Zusammenfassungsfelder, um anzugeben, welche Felder aus dem Eingabe-Dataset zusammengefasst werden sollen. Die folgenden Summenstatistiken sind verfügbar:
- Summe: Die Summe der numerischen Werte in einem Feld. Die Summe von [null, 1, 3] ist 4.
- Min: Der Minimalwert eines numerischen Feldes oder Datumsfeldes. Das Minimum von [0, 2, null] ist 0.
- Max: Der Maximalwert eines numerischen Feldes oder Datumsfeldes. Das Maximum von [0, 2, null] ist 2.
- Mittelwert: Der Mittelwert der numerischen Werte. Der Mittelwert von [0, 2, null] ist 1.
- Standardabweichung: Die Standardabweichung eines numerischen Feldes. Die Standardabweichung von [null, 1, 1, 1] ist 0.
- Anzahl: Die Anzahl der Nicht-NULL-Werte. Kann für ein Feld jedes beliebigen Typs verwendet werden. Die Anzahl von [null, "hello", "world"] ist 2.
- Beliebig: Dies ist ein Beispielwert aus einem Feld eines beliebigen Typs.
Ausgaben
Die Ausgabe des Werkzeugs ist eine Tabelle mit berechneten Statistiken. Zusätzlich zu allen Feldern, die mit dem Parameter Abzugleichende Felder angegeben wurden, sind die folgenden Felder im Ausgabeergebnis verfügbar:
Feldname | Beschreibung |
---|---|
COUNT | Die Anzahl der Datensätze, die im neuen Datensatz zusammengeführt wurden. Dieses Feld ist immer in der Ausgabe enthalten. |
STATISTIC_fieldname | Für jede der angegebenen Statistiken wird ein Attributfeld mit einem Namen im folgenden Format erstellt: STATISTIC_Feldname. Der Mittelwert des Feldes measurement ist zum Beispiel MEAN_measurement. |
Einschränkungen
Für das Werkzeug Attribute zusammenfassen sind die folgenden Einschränkungen bekannt:
- Datensätze mit leeren, NULL- oder ungültigen Geometrien werden von der Verarbeitung ausgeschlossen und ihre Werte werden nicht in den Berechnungen der Summenstatistik verwendet.
- Mit "Attribute zusammenfassen" erfolgt keine Zusammenfassung basierend auf räumlichen Beziehungen. Um Statistiken für Polygone oder Polylinien zu berechnen, die sich überschneiden oder gemeinsame Attribute aufweisen, verwenden Sie das Werkzeug Zusammenführen. Um Statistiken für Tabellen oder Geometrien zu berechnen, die auf Attributbeziehungen, räumlichen oder zeitlichen Beziehungen basieren, verwenden Sie das Werkzeug Verbinden.
Lizenzanforderungen
Die folgenden Lizenzen und Konfigurationen werden benötigt:
- Benutzertyp Creator oder Professional
- Publisher-, Vermittler- oder Administratorrolle oder eine entsprechende benutzerdefinierte Rolle
Weitere Informationen zu den Anforderungen für Data Pipelines finden Sie unter Anforderungen.