Attribute zusammenfassen

Werkzeugsymbol Verfügbar in Big-Data-Analysen.

Mit dem Werkzeug "Attribute zusammenfassen"Symbol des Werkzeugs "Attribute zusammenfassen" werden gleiche Feldwerte zum Erstellen einer Summentabelle zusammengefasst. Der resultierende Layer zeigt die Anzahl der zusammengefassten Features und alle zusätzlich angegebenen Statistiken an.

Workflow-Diagramm

Workflow-Diagramm des Werkzeugs "Attribute zusammenfassen"

Beispiel

Tornados und Hurrikane zählen zu den zerstörerischsten Stürmen in den USA. Sie möchten Sachbeschädigungen und finanzielle Verluste für Tornados und Hurrikane analysieren, um deren unterschiedliche Auswirkungen zu vergleichen. Sie haben Zugriff auf Tornado- und Hurrikandaten in den USA in einem einzelnen Dataset und möchten alle Informationen zusammenfassen, um jeweils eine Übersicht der Werte für alle Hurrikane bzw. Tornados anzuzeigen. Sie können Ihre Daten mithilfe des Sturmtyps zusammenfassen, um die Statistiken für jeden Sturmtyp zu ermitteln.

Verwendungshinweise

  • Bei "Attribute zusammenfassen" handelt es sich um ein Werkzeug für Tabellenanalysen, nicht für räumliche Analysen. Die Ausgabetabelle enthält Felder mit den Ergebnissen der statistischen Operation.
  • Mit dem Parameter Felder können Sie können ein oder mehrere Felder zum Zusammenfassen angeben oder alle Features zusammenfassen. Wenn Sie nach einem einzelnen Feld zusammenfassen, wird die Statistik für jeden eindeutigen Attributwert berechnet. Wenn Sie nach mehrere Feldern zusammenfassen, wird die Statistik für jede eindeutige Kombination aus Attributwerten berechnet.
  • Die Ausgabe dieses Werkzeugs enthält immer die Anzahl der Features, die zusammengefasst wurden.
  • Eine zusätzliche Statistik kann durch Verwendung des Parameters Summenfelder berechnet werden. Die verfügbaren Zusammenfassungsfeld-Statistiken richten sich nach dem Feldtyp, den Sie zusammenfassen. Für ein Attributfeld vom Typ "Zeichenfolge" können die Statistiken "Beliebig", "Anzahl" und "Anzahl (diskret)" verwendet werden. Für ein Attributfeld vom Typ "Numerisch" können die Statistiken "Beliebig", "Anzahl", "Anzahl (diskret)", "Summe", "Summe der Quadrate", "Minimum", "Maximum", "Bereich", "Varianz" und "Standardabweichung" verwendet werden. Für ein Attributfeld vom Typ "Datum" können die Statistiken "Beliebig", "Anzahl", "Minimum", "Maximum" und "Bereich" verwendet werden.

Funktionsweise des Werkzeugs "Attribute zusammenfassen"

Im Folgenden wird die Funktionsweise des Werkzeugs "Features verbinden" beschrieben.

Gleichungen

Varianz wird mit der folgenden Gleichung berechnet:

Gleichung für Varianz
Varianzvariablen

Die Standardabweichung wird als Quadratwurzel der Varianz berechnet.

Berechnungen

Eingabe-Layer werden in Gruppen mit übereinstimmenden Feldwerten zusammengefasst. Die Ergebnisse sind tabellarisch und können daher nicht auf der Karte visualisiert werden.

Die nachfolgende Tabelle veranschaulicht die statistischen Berechnungen eines Layers, der mithilfe von identischen Feldwerten zusammengefasst werden. Das Feld VO2 wurde verwendet, um die numerischen Statistiken (Anzahl, Summe, Minimum, Maximum, Bereich, Mittelwert, Standardabweichung und Varianz) für den Layer zu berechnen. Mit dem Feld Rating wurde die Zeichenfolgenstatistik (Anzahl und Beliebige) für den Layer berechnet.

Eingabe-Layer, der zusammengefasst werden soll
Der Eingabe-Layer, der zusammengefasst werden soll, wird angezeigt.

Die obige Tabelle wurde nach dem Feld Designation zusammengefasst. Das Feld VO2 wurde zum Berechnen der numerischen Statistiken (Anzahl,Summe, Minimum, Maximum, Bereich, Mittelwert, Standardabweichung und Varianz) für den Layer verwendet. Mit dem Feld Rating wurde die Zeichenfolgenstatistik (Anzahl und Beliebige) für den Layer berechnet. Als Ergebnis wird eine Tabelle mit zwei Features ausgegeben, die die eindeutigen Werte von Designation darstellen.

Eingabe-Layer, der mit dem Feld "Designation" zusammengefasst wurde
Der Eingabe-Layer, der mit dem Feld "Designation" zusammengefasst wurde, wird angezeigt.

Die folgende Tabelle zeigt, wie die ersten Felder aussehen, wenn der Layer mit den Feldern Designation und Age Group zusammengefasst wird. Statistiken werden mit derselben Methode wie im vorherigen Beispiel berechnet.

Eingabe-Layer, der mit den Feldern "Designation" und "AgeGroup" zusammengefasst wurde
Der Eingabe-Layer, der mit den Feldern Designation und Age Group zusammengefasst wurde, wird angezeigt.

Mit der Zählstatistik (für Zeichenfolgen und numerische Felder) wird die Anzahl der Nicht-NULL-Werte ermittelt. Die Anzahl der folgenden Werte ist gleich 5: [0, 1, 10, 5, null, 6] = 5. Die Anzahl dieser Gruppe von Werten ist gleich 3: [Primary, Primary, Secondary, null] = 3.

Parameter

ParameterErläuterungDatentyp

Eingabe-Layer

Die Punkt-Features, für welche die Dichte berechnet wird.

Features

Felder (optional)

Ein oder mehrere Felder zur Zusammenfassung ähnlicher Features. Wenn Sie beispielsweise ein einzelnes Feld namens PropertyType mit den Werten von Gewerbe- oder Wohngebäuden ausgewählt haben, werden alle Wohngebäudefelder, mit berechneten Summenstatistiken, und alle Gewerbefelder zusammengefasst.

Wenn Sie mehrere Felder auswählen, wird jede eindeutige Kombination aus Werten mit berechneten Summenstatistiken zusammengefasst. Angenommen, Sie haben ein erstes Feld namens PropertyType mit den Werten von Gewerbe- oder Wohngebäuden und ein zweites Feld namens Occupied mit den Werten Ja oder Nein ausgewählt. Dann gibt es für die Zusammenfassung mit berechneten Summenstatistiken vier mögliche Kombinationen.

Zeichenfolge

Zusammenfassungsfelder (optional)

Die Statistiken, die für bestimmte Felder berechnet werden. Je nachdem, ob es sich bei dem angegebenen Feld um ein numerisches, ein Zeichenfolgen- oder ein Datumsfeld handelt, sind unterschiedliche Statistiken verfügbar.

Es stehen die folgenden Statistiktypen zur Verfügung:

  • Beliebig: Dies ist eine Beispielzeichenfolge aus einem Feld vom Typ "Zeichenfolge".
  • Anzahl: Berechnet die Anzahl der Nicht-NULL-Werte. Es kann für numerische Felder oder Zeichenfolgen verwendet werden. Die Anzahl von [NULL, 0, 2] beträgt 2.
  • Anzahl (diskret): Berechnet die Anzahl der eindeutigen Nicht-NULL-Werte. Es kann für numerische Felder oder Zeichenfolgen verwendet werden. Das Ergebnis der "Anzahl (diskret)" von [NULL, 4, 3, 4] beträgt 2.
  • Summe: Die Summe der numerischen Werte in einem Feld. Die Summe von [NULL, 1, 3] beträgt 4.
  • Quadratsumme: Die Summe der quadrierten Differenzen der einzelnen Beobachtungen aus dem Gesamtmittelwert, aus allen Beobachtungen. Die Summe der Quadrate von [NULL, 2,2, 3,1, 4,7] beträgt 3,206.
  • Minimum: Der Minimalwert eines numerischen Feldes. Der Minimalwert von [0, 2, NULL] beträgt 0.
  • Maximum: Der Maximalwert eines numerischen Feldes. Der Maximalwert von [0, 2, NULL] beträgt 2.
  • Mittelwert: Der Mittelwert der numerischen Werte. Der Mittelwert von [0, 2, NULL] beträgt 1.
  • Bereich: Der Bereich eines numerischen Feldes. Dieser wird durch die Subtraktion der Minimalwerte vom Maximalwert berechnet. Der Bereich von [0, NULL, 1] lautet 1. Der Bereich von [NULL, 4] lautet 0.
  • Varianz: Die Varianz eines numerischen Feldes in einem Track. Die Varianz von [1] beträgt NULL. Die Varianz von [NULL, 1,1,1] beträgt 1.
  • Standardabweichung: Die Standardabweichung eines numerischen Feldes. Die Standardabweichung von [1] ist NULL. Die Standardabweichung von [NULL, 1,1,1] ist 1.

Zeichenfolge

Ausgabe-Layer

Der Ausgabe-Layer ist eine Tabelle, die die im Parameter Felder bereitgestellten Felder, ein Attribut mit der Anzahl der anhand dieses Datensatzes zusammengefassten Features sowie die im Parameter Zusammenfassungsfelder angegebenen zusammengefassten Attribute enthält.

Überlegungen und Beschränkungen

  • Eingaben können ein Tabellen-Layer oder ein Layer mit Geometrie (Punkte, Linien oder Flächen) sein.
  • Sie können dieses Werkzeug mit räumlichen Daten verwenden. Das Ergebnis ist jedoch eine Tabelle. Mit dem Werkzeug Features verbinden können Sie anschließend die Ergebnisse mit räumlichen Daten verbinden.