Zusammenfassen (innerhalb)

Werkzeugsymbol Verfügbar in Big-Data-Analysen.

Mit dem Werkzeug Zusammenfassen (innerhalb) werden Statistiken in Flächen berechnet, in denen sich ein Eingabe-Layer innerhalb einer Grenze befindet oder einen Grenz-Layer überlappt. Die zusammengefasste Fläche kann ein Flächen-Layer bzw. ein hexagonaler oder quadratischer Abschnitt sein.

Workflow-Diagramm

Workflow-Diagramm des Werkzeugs "Zusammenfassen (innerhalb)"

Beispiele

  • Ein Kabelanbieter startet ein Pilotprogramm, bei dem Studenten mit niedrigem Einkommen in einer Gemeinde ein preiswerter Internetzugang angeboten wird. "Zusammenfassen (innerhalb)" nach Abschnitten kann verwendet werden, um die Anzahl der Studierenden mit geringem Einkommen in quadratischen Abschnitten mit einer definierten Größe zu ermitteln, sodass der Kabelanbieter eine entsprechende Region für sein Pilotprogramm bestimmen kann.
  • Um die Routinewartungsprojekte effizient abzuschließen, verwendet die Stadt "Zusammenfassen (innerhalb)", um die Anzahl der Straßenlampen und die Kilometerzahl der Radwege in jedem Verwaltungsbezirk zu ermitteln. Anschließend lassen sich der erforderliche Materialaufwand und die Anzahl der Mitarbeiter in den jeweiligen Bezirken schätzen.

Verwendungshinweise

  • Bei dem Eingabe-Layer, der zusammengefasst werden soll, kann es sich um einen Punkt-, Linien- oder Polygon-Layer handeln.
  • Der Ausgabe-Layer ist immer eine Polygon-Fläche oder ein Abschnitts-Layer, und nur die Flächen-Features oder Abschnitts-Features mit zusammengefassten Features werden zurückgegeben.
  • Sie können sich die Option "Zusammenfassen (innerhalb)" als zwei Layer, die Flächen-Features und die Eingabe-Zusammenfassungs-Features, vorstellen, die übereinander gestapelt sind. Nachdem diese Layer gestapelt wurden, sehen Sie von oben durch den Stapel hindurch und ermitteln die Anzahl der Eingabe-Zusammenfassungs-Features, die sich in den Flächen befinden. Neben der Anzahl der Features können Sie auch einfache Statistiken zu den Attributen der Eingabe-Zusammenfassungs-Features berechnen, z. B. "Summe", "Mittelwert", "Minimum", "Maximum" usw.
  • Mit "Zusammenfassen (innerhalb)" können Sie Standardstatistiken und geographisch gewichtete Statistiken berechnen. Standardstatistiken fassen die statistischen Werte ohne Gewichtung zusammen. Gewichtete Statistiken berechnen Werte anhand der geographisch gewichteten Werte der Proportion von Linien innerhalb eines Polygon oder der Proportion von Polygonen innerhalb eines Polygons. Gewichtete Statistiken gelten nicht für Punkte innerhalb von Polygonen.

Funktionsweise des Werkzeugs "Zusammenfassen (innerhalb)"

Gleichungen

Bei zusammengefassten Linien- und Flächen-Features umfassen gewichtete Statistiken Gewichtungen für das Zusammenfassungsgebiet. Es werden keine Statistiken für Punkt-Features gewichtet. Die folgende Tabelle zeigt die Gleichungen zum Berechnen der Varianz, des gewichteten Mittelwertes und der gewichteten Standardabweichung.

StatistikGleichungVariablenFeatures

Varianz

Gleichung für VarianzVariablen für Varianz

Punkte

Gewichteter Mittelwert

Gleichung für gewichteten Mittelwert

Variablen für gewichteten Mittelwert

Gewichtungen werden als Prozentsatz des Features i im Zusammenfassungsgebiet berechnet.

Linien und Flächen

Gewichtete Standardabweichung

Gleichung für gewichtete Standardabweichung

Variablen für gewichtete Standardabweichung

Gewichtungen werden als Prozentsatz des Features i im Zusammenfassungsgebiet berechnet.

Linien und Flächen

Punkte

Punkt-Layer werden nur anhand der Punkt-Features innerhalb des Zusammenfassungsgebiets zusammengefasst. Gewichtete Statistiken können beim Zusammenfassen von Punkten nicht angewendet werden.

Anhand der Abbildung und Tabelle unten werden die statistischen Berechnungen eines zusammengefassten Punkt-Layers innerhalb einer hypothetischen Grenze erläutert. Das Feld Population wurde verwendet, um die Statistiken (Anzahl, Summe, Minimum, Maximum, Bereich, Mittelwert, Standardabweichung und Varianz) für den Layer zu berechnen.

Zusammenfassen eines Punkt-Layers
Punkt-Layer werden nur anhand von Punkten innerhalb des Flächen-Layers verortet. Es wird eine Attributtabelle mit Werten angezeigt, die in Berechnungen von hypothetischen Statistiken herangezogen werden.

Numerische StatistikErgebnisbezirk A

Anzahl

Anzahl von:

[280, 408, 356, 361, 450, 713] = 6

Summe

280 + 408 + 356 + 361 + 450 + 713 = 2.568

Minimum

Minimum:

[280, 408, 356, 361, 450, 713] = 280

Maximum

Maximum:

[280, 408, 356, 361, 450, 713] = 713

Bereich

713 - 280 = 433

Mean

2568/6 = 428

Varianz

Varianz von Punkten
= 22737,2

Standardabweichung

Standardabweichung von Punkten
= 150,7886

ZeichenfolgenstatistikErgebnisbezirk A

Anzahl

= 6

Beliebig

= Weiterführende Schule

Hinweis:

Mit der Zählstatistik (für Zeichenfolgen und numerische Felder) wird die Anzahl der Nicht-NULL-Werte ermittelt. Die Anzahl von [0, 1, 10, 5, null, 6] ist beispielsweise 5. Die Anzahl von [Primary, Primary, Secondary, null] ist 3.

Ein reales Szenario, in dem diese Analysen verwendet werden können, ist die Ermittlung der Gesamtzahl von Schülern in einem Schulbezirk. Jeder Punkt stellt eine Schule dar. Über das Feld Type wird der Schultyp (Grund-, Mittel- oder weiterführende Schule) angegeben und über ein Feld für die Schülerschaft die Anzahl der in jeder Schule angemeldeten Schüler. Die Berechnungen und Ergebnisse sind in der Tabelle oben für den Bezirk A angegeben. Die Ergebnisse zeigen, dass der Bezirk A 2.568 Schüler umfasst. Wenn das Werkzeug Zusammenfassen (innerhalb) ausgeführt wird, werden auch die Ergebnisse für den Bezirk B angegeben.

Linien

Für gewichtete Statistiken werden Linien-Layer nur anhand der Proportionen der Linien-Features zusammengefasst, die sich innerhalb des Zusammenfassungsgebiets befinden. Standardstatistiken (nicht gewichtete) fassen alle Linien zusammen, die das Zusammenfassungsgebiet schneiden. Verwenden Sie beim Zusammenfassen von Linien mit gewichteten Statistiken Anzahl und Mengen (statt Verhältnisse oder Indizes), sodass proportionale Berechnungen in Ihrer Analyse logisch sinnvoll sind.

Anhand der Abbildung und Tabelle unten werden die statistischen Berechnungen eines zusammengefassten Linien-Layers innerhalb eines hypothetischen Zusammenfassungsgebiets erläutert. Das Feld Volume wurde verwendet, um die Statistiken (Anzahl, Summe, Minimum, Maximum, Bereich, Mittelwert, Standardabweichung und Varianz) für den Layer zu berechnen. Die Standardstatistiken werden mithilfe von Linien berechnet, die die Grenze schneiden, und die gewichteten Statistiken werden mit der Proportion der Linien berechnet, die sich im Zusammenfassungebiet befinden.

Zusammenfassen eines Linien-Layers
Linien-Layer werden mit Standardstatistiken und gewichteten Statistiken zusammengefasst.

Numerische StatistikStandardstatistikGewichtete Statistik

Gewichtungen berechnen

Nicht anwendbar

Gewichtung der braunen Linie (Wert = 600):

2/3 = 0,6667

Gewichtung der blauen Linie (Wert = 1000):

3/6 = 5

Anzahl

Anzahl von:

[1000, 600] = 2

Anzahl von:

1 x (3/6) + 1 x (2/3) = 1,1667

Summe

1000 + 600 = 1600
1000 x (3/6) + 600 x (2/3) = 900

Minimum

Minimum:

[1000, 600] = 600

Minimum:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 400

Maximum

Maximum:

[1000, 600] = 1000

Maximum:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 500

Bereich

1000 - 600 = 600
500 - 400 = 100

Mean

(1000 + 600)/2 = 800
(1000 x (3/6) + 600 x (2/3))/(3/6 + 2/3)
(500 + 400)/(7/6) = 771,4286

Varianz

Varianz von Linien
= 80000
Gewichtete Varianz von Linien
= 1268571,4286

Standardabweichung

Standardabweichung von Linien
= 282,8427
Gewichtete Standardabweichung von Linien
= 1126,3088

Ein reales Szenario, in dem diese Analysen verwendet werden können, ist die Ermittlung des Gesamtvolumens an Wasser in Flüssen innerhalb der Grenzen eines staatlichen Parks. Jede Linie stellt einen Fluss dar, der sich teilweise innerhalb des Parks befindet. Die Ergebnisse zeigen, dass 5 Flussmeilen innerhalb des Parks liegen und das Gesamtvolumen 900 Einheiten beträgt.

Areas

Flächen-Layer werden nur anhand der Proportionen der Flächen-Features zusammengefasst, die sich innerhalb der Eingabegrenze befinden. Verwenden Sie beim Zusammenfassen von Flächen Felder mit absoluten Zahlen, sodass proportionale Berechnungen in der Analyse logisch sinnvoll sind.

Gewichtete Statistiken für Zusammenfassungsgebiet-Layer basieren auf den Proportionen der Zusammenfassungsgebiet-Features, die sich im Zusammenfassungs-Layer befinden. Verwenden Sie beim Zusammenfassen von Flächen Anzahl oder Mengen (statt Verhältnisse oder Indizes), sodass proportionale Berechnungen in Ihrer Analyse logisch sinnvoll sind.

Anhand der Abbildung und Tabelle unten werden die statistischen Berechnungen eines Flächen-Layers innerhalb eines hypothetischen Zusammenfassungsgebiets erläutert. Das Feld "Population" wurde verwendet, um die Statistiken (Anzahl,Summe, Minimum, Maximum, Bereich, Mittelwert, Standardabweichung und Varianz) für den Layer zu berechnen. Die Standardstatistiken werden mit Flächen berechnet, die das Zusammenfassungsgebiet schneiden, und die gewichteten Statistiken werden mit einer proportionalen Gewichtung basierend auf dem Anteil der Zusammenfassungsgebiete berechnet, die in jedem Zusammenfassungs-Layer enthalten sind.

Zusammenfassen eines Flächen-Layers
Zusammenfassungsstatistiken werden für Flächen im Zusammenfassungs-Layer berechnet, die die Zusammenfassungsgebiete schneiden. Gewichtungen basieren auf der Proportion der Zusammenfassungsgebiete, die die Features des Zusammenfassungs-Layers überlappen.

Numerische StatistikStandardstatistik: Ergebnisse Nachbarschaft 1Gewichtete Statistik: Ergebnisse Nachbarschaft 1

Gewichtungen berechnen

Gewichtung der gelben Fläche (Wert = 3200):

4/(2+4) = 4/6

Gewichtung der grünen Fläche (Wert = 4700):

4/(2+4) = 2/3

Gewichtung der rosafarbenen Fläche (Wert = 1000):

1/(1+1,5) = 2/5

Gewichtung der blauen Fläche (Wert = 4500):

6/(2+6) = 3/4

Gewichtung der orangefarbenen Fläche (Wert = 3600):

2/(2+2) = 1/2

Anzahl

Anzahl von:

[3200, 4700, 1000, 4500, 3600] = 5

Anzahl von:

(2/3)+(2/3)+ (2/5)+(3/4)+ (1/2) = 2,98

Summe

3200 + 4700 + 1000 + 4500 + 3600 = 17000
(3/4) x 3200 +(2/3) x 4700 + (2/5) x 1000 +(3/4) x 4500 + (1/2) x 3600 = 10841,67

Minimum

Minimum:

[3200, 4700, 1000, 4500, 3600] = 1000

Minimum:

[(2/3) x 3200, (2/3) x 4700, (2/5) x 1000, (3/4) x 4500, (1/2) x 3600]
[2133,33, 3133,33, 400, 3375, 1800] = 400

Maximum

Maximum:

3200, 4700, 1000, 4500, 3600] = 4700

Maximum:

[2133,33, 3133,33, 400, 3375, 1800] = 3375

Bereich

4700 - 1000 = 3700
3375 - 400 = 2.975

Mean

(17000)/5 = 3400
(10841,67)/[2,9833] = 3634,12

Varianz

Varianz von Flächen
= 2185000
Gewichtete Varianz von Flächen
= 1727137,5112

Standardabweichung

Standardabweichung von Flächen
= 1478,175
Gewichtete Standardabweichung von Flächen
= 1314,2060

Parameter

ParameterBeschreibungDatentyp

Eingabe-Layer

Die Punkt-, Linien- oder Polygon-Features, die innerhalb von Flächen-Features zusammengefasst werden.

Features

Abschnittstyp

Die Abschnittsform, die zum Erstellen der regelmäßigen Abschnitte verwendet wird. Die Optionen sind Quadrat und Hexagon.

Wenn eine Polygonquelle mit dem Verbindungs-Port dieses Werkzeugs verbunden ist, wird dieser Parameter nicht mehr angezeigt bzw. ist nicht mehr erforderlich.

Zeichenfolge

Abschnittsgröße

Das Entfernungsintervall, das die Abschnittsgröße darstellt, in die die Eingabe-Punkte aggregiert werden. Bei Quadratabschnitten stellt die Abschnittsgröße die Höhe des Quadrats dar. Dies ist die Standardeinstellung. Bei hexagonalen Abschnitten stellt die Abschnittsgröße die Höhe zwischen zwei parallelen Seiten dar.

Wenn eine Polygonquelle mit dem Verbindungs-Port dieses Werkzeugs verbunden ist, wird dieser Parameter nicht mehr angezeigt bzw. ist nicht mehr erforderlich.

Zeichenfolge

Shapes zusammenfassen

Gibt an, ob Shape-Informationen (Länge von Linien oder Fläche von Polygonen) im Rahmen der Analyse zusammengefasst werden sollen. Wenn es sich bei den Eingabe-Zusammenfassungs-Features um Punkte handelt, gibt es keine Shape-Informationen zum Zusammenfassen. Dann wird lediglich die Anzahl der Punkte in den einzelnen Flächen-Features hinzugefügt.

Boolesch

Shape-Einheiten

Die Einheit, in der Shape-Zusammenfassungsattribute berechnet werden. Wenn die Eingabe-Zusammenfassungs-Features Linien sind, geben Sie eine lineare Einheit ein. Wenn die Eingabe-Zusammenfassungs-Features Polygone sind, geben Sie eine Flächeneinheit an.

Zeichenfolge

Zusammenfassungsfelder

Die Statistiken, die für bestimmte Felder berechnet werden. Je nachdem, ob es sich beim angegebenen Feld um ein numerisches, ein Zeichenfolgen- oder ein Datumsfeld handelt, sind unterschiedliche Statistiken verfügbar.

  • Beliebig: Dies ist eine Beispielzeichenfolge aus einem Feld vom Typ "Zeichenfolge".
  • Anzahl: Berechnet die Anzahl der Nicht-NULL-Werte. Es kann für numerische Felder oder Zeichenfolgen verwendet werden. Die Anzahl von [NULL, 0, 2] beträgt 2.
  • Anzahl (diskret): Berechnet die Anzahl der eindeutigen Nicht-NULL-Werte. Es kann für numerische Felder oder Zeichenfolgen verwendet werden. Das Ergebnis der "Anzahl (diskret)" von [NULL, 4, 3, 4] beträgt 2.
  • Summe: Die Summe der numerischen Werte in einem Feld. Die Summe von [NULL, 1, 3] beträgt 4.
  • Quadratsumme: Die Summe der quadrierten Differenzen der einzelnen Beobachtungen aus dem Gesamtmittelwert, aus allen Beobachtungen. Die Summe der Quadrate von [NULL, 2,2, 3,1, 4,7] beträgt 3,206.
  • Minimum: Der Minimalwert eines numerischen Feldes. Der Minimalwert von [0, 2, NULL] beträgt 0.
  • Maximum: Der Maximalwert eines numerischen Feldes. Der Maximalwert von [0, 2, NULL] beträgt 2.
  • Mittelwert: Der Mittelwert der numerischen Werte. Der Mittelwert von [0, 2, NULL] beträgt 1.
  • Bereich: Der Bereich eines numerischen Feldes. Dieser wird durch die Subtraktion der Minimalwerte vom Maximalwert berechnet. Der Bereich von [0, NULL, 1] lautet 1. Der Bereich von [NULL, 4] lautet 0.
  • Varianz: Die Varianz eines numerischen Feldes in einem Track. Die Varianz von [1] beträgt NULL. Die Varianz von [NULL, 1, 1, 1] beträgt 1.
  • Standardabweichung: Die Standardabweichung eines numerischen Feldes. Die Standardabweichung von [1] ist NULL. Die Standardabweichung von [NULL, 1, 1, 1] ist 1.

Zeichenfolge

Gewichtete Statistik

Die geographisch gewichteten Statistiken, die für bestimmte Felder berechnet werden. Gewichtete Statistiken berechnen Werte anhand der geographisch gewichteten Werte der Proportion von Linien innerhalb eines Polygon oder der Proportion von Polygonen innerhalb eines Polygons. Gewichtete Statistiken gelten nicht für Punkte innerhalb von Polygonen. Je nachdem, ob es sich beim angegebenen Feld um ein numerisches, ein Zeichenfolgen- oder ein Datumsfeld handelt, sind unterschiedliche Statistiken verfügbar.

  • Anzahl: Berechnet die Anzahl der Nicht-NULL-Werte. Es kann für numerische Felder oder Zeichenfolgen verwendet werden. Die Anzahl von [NULL, 0, 2] beträgt 2.
  • Summe: Die Summe der numerischen Werte in einem Feld. Die Summe von [NULL, 1, 3] beträgt 4.
  • Minimum: Der Minimalwert eines numerischen Feldes. Der Minimalwert von [0, 2, NULL] beträgt 0.
  • Maximum: Der Maximalwert eines numerischen Feldes. Der Maximalwert von [0, 2, NULL] beträgt 2.
  • Mittelwert: Der Mittelwert der numerischen Werte. Der Mittelwert von [0, 2, NULL] beträgt 1.
  • Bereich: Der Bereich eines numerischen Feldes. Dieser wird durch die Subtraktion der Minimalwerte vom Maximalwert berechnet. Der Bereich von [0, NULL, 1] lautet 1. Der Bereich von [NULL, 4] lautet 0.

Zeichenfolge

Ausgabe-Layer

Der Ausgabe-Layer enthält anstelle der ursprünglichen Felder die folgenden Felder. Wenn Sie Zusammenfassungsfelder konfiguriert haben, werden diese Felder ebenfalls für den Ausgabe-Layer berechnet.

FeldnameBeschreibungFeldtyp

COUNT

Die Anzahl der Features aus dem Eingabe-Layer, die in diesem Polygon-Abschnitt zusammengefasst wurden.

Float64

sum_length_<Einheiten>

Wenn es sich beim Eingabe-Layer um ein Polylinien-Feature handelt und der Parameter Shapes zusammenfassen auf Ja festgelegt ist, wird von der Ausgabe dieses Feld generiert, in dem die Gesamtlänge von Polylinien-Features in den einzelnen Abschnitten in den durch den Parameter Shape-Einheiten angegebenen Einheiten angegeben wird.

Float64

sum_area_<Einheiten>

Wenn es sich beim Eingabe-Layer um ein Polygon-Feature handelt und der Parameter Shapes zusammenfassen auf Ja festgelegt ist, wird von der Ausgabe dieses Feld generiert, in dem die Gesamtfläche von Polygon-Features in den einzelnen Abschnitten in den durch den Parameter Shape-Einheiten angegebenen Einheiten angegeben wird.

Float64

Überlegungen und Beschränkungen

Linien und Flächen werden anhand von Proportionen zusammengefasst; daher ist es optimal, absolute Daten (z. B. Bevölkerung) statt relative Daten (z. B. Durchschnittseinkommen) zusammenzufassen, wenn Linien oder Flächen zusammengefasst werden.