Berechnete Schätzwerte für von Benutzern erstellte Gebiete

ArcGIS Business Analyst Web App nutzt den GeoEnrichment-Service, in dem zum Definieren der Position des Punktes oder der Fläche, den bzw. die Sie mit zusätzlichen Informationen anreichern möchten, das Konzept "Untersuchungsgebiet" verwendet wird. Wenn ein oder mehrere Punkte als Untersuchungsgebiet eingegeben werden, erstellt der Service einen Ringpuffer von einer Meile um den Punkt bzw. die Punkte, um Anreicherungsdaten zu erfassen und anzuhängen. Optional können Sie die Größe des Ringpuffers ändern oder Fahrzeit-Einzugsgebiete um einen Punkt erstellen.

Der GeoEnrichment-Service verwendet eine differenzierte geographische Abfragemethodik, um Daten für Ringe und andere Polygone zu aggregieren. Eine geographische Abfragemethodik bestimmt, wie Daten gesammelt und für Eingabe-Features zusammengefasst oder aggregiert werden. Für geographische Standardeinheiten, z. B. Bundesländer, Kantone, Landkreise oder Postleitzahlen, ist die Verknüpfung zwischen einem angegebenen Gebiet und seinen Attributdaten eine einfache Eins-zu-Eins-Beziehung. Wenn z. B. ein Eingabe-Layer für ein Absatzgebiet eine Auswahl von Postleitzahlen enthält, handelt es sich bei der Datenabfrage einfach um das Sammeln der Daten dieser Gebiete.

Datenzuordnungsmethode

Durch die Datenzuordnungsmethode werden benutzerdefinierten Gebieten Blockgruppendaten zugeordnet. Dabei wird die Bevölkerung in der Blockgruppe untersucht und die Größe des Anteils der Bevölkerung einer Blockgruppe bestimmt, der ein benutzerdefiniertes Gebiet überlappt. Diese Methode wird in den USA und auf ähnliche Weise in Kanada verwendet. Anhand der für Census Blocks - eine detailliertere Geographieebene als Blockgruppen - vorliegenden Bevölkerungsdaten wird die Verteilung der Bevölkerung innerhalb einer Blockgruppe bestimmt. Wenn der geographische Mittelpunkt eines Blocks im benutzerdefinierten Gebiet liegt, werden die Blockgruppendaten anhand der gesamten Bevölkerung des Blocks gewichtet. Die geographische Verteilung der Bevölkerung auf Zählblockebene bestimmt den Anteil der Zählblockgruppen-Daten, die den benutzerdefinierten Gebieten zugeordnet werden, wie im Beispiel gezeigt.

Berechnete Schätzwerte
Hinweis:

Abhängig von den Daten werden Haushalte, Wohneinheiten oder Unternehmen auf Blockgruppenebene als Gewichtung verwendet. Die Nutzung von Block-Schwerpunkten ist von Vorteil, da dabei die Möglichkeit berücksichtigt wird, dass die Bevölkerung nicht in der gesamten Blockgruppe gleichmäßig geographisch verteilt ist.

Funktionsweise der Datenaufschlüsselung

ArcGIS Business Analyst Web App nutzt einen Datenaufschlüsselungsalgorithmus zur Verteilung von demografischen, geschäftlichen, wirtschaftlichen und landschaftsbezogenen Variablen auf Eingabe-Polygon-Features. Der Algorithmus analysiert die einzelnen Polygone, die angereichert werden sollen, relativ zu einem Punkt-Dataset und einem detaillierten Dataset von Berichterstattungseinheit-Polygonen mit Attributen für die ausgewählten Variablen. Abhängig davon, wie ein anzureicherndes Polygon diese Datasets überlagert, bestimmt der Algorithmus die entsprechende Menge, die jeder Variable zugewiesen werden soll.

Je nach dem Land, in dem sich das Anreicherungs-Polygon befindet, stellt das granulare Punkt-Dataset eine der folgenden Optionen dar:

  • Census Block Points: Nur USA und Kanada. Diese Punkte werden anfänglich als Schwerpunkte der detailliertesten Erhebungsgebiete für die Berechnung in diesen Ländern erzeugt: Census Blocks in den USA und Verbreitungsgebiete in Kanada. In einigen Fällen wurden diese Punkte von Esri aus vorwiegend industriell genutzten oder anderen nicht zu Wohngebieten zählenden Flächen in Wohngebiete verschoben. Jeder Punkt enthält Attribute für die Anzahl der Menschen und Haushalte, die sich im entsprechenden Berechnungsgebiet befinden.
  • Settlement points: Für die meisten Länder erzeugt Esri Siedlungspunkte basierend auf einem Wahrscheinlichkeitsmodell für die Besiedelung, das auf Landsat8-Bilddaten und Straßenkreuzungen beruht. Straßenkreuzungen sind vor allem dort hilfreich, wo Gebäude aufgrund der dichten Bewaldung nicht erkennbar sind. Siedlungspunkte werden zunächst als dasymetrische Raster-Oberfläche erzeugt und beziehen sich damit auf Punkte, an denen Menschen nicht leben können oder die verlassen wurden. Diese Raster-Oberfläche wird mit einer Auflösung von 75 Metern erzeugt, was ungefähr der Größe eines Gebäudeblocks entspricht. Das Modell weist jeder Zelle oder jedem Punkt eine Wahrscheinlichkeitspunktzahl für die Besiedlung zu, mit der angegeben wird, wie hoch die Wahrscheinlichkeit ist, dass Menschen dort leben.
  • Adressbasierte Settlement Points: Nur Schweiz und Niederlande. Einige Länder veröffentlichen die Punkte der Wohnadressen ihrer Bürger direkt. Esri aggregiert die Anzahl dieser Adresspunkte in einem Raster mit einer Auflösung von 75 Metern und konvertiert dieses in ein Punkt-Dataset, das Besiedlungspunkten entspricht.
  • Settlement Points für Gebäude-Footprints: Nur AIS-Gruppendaten für Spanien. Die Anzahl der Gebäude-Footprint-Schwerpunkte von Wohngebäuden wird auf ein Raster mit einer Auflösung von 75 Metern summiert, um ein Dataset aus Settlement Points zu erzeugen.

Der GeoEnrichment-Service verwendet Geographien der höchsten Detaillierungsebene mit den neuesten Volkszählungsdaten bzw. verlässlichen Schätzungen, die zu den einzelnen Ländern für die kommerzielle Verwendung verfügbar sind. Für das Jahr 2018 beispielsweise verfügt das Dataset von Südafrika über 85.483 Features, das Dataset von Ungarn über 3.177 Features und das Dataset von Japan über 217.201 Features.

Die Daten der meisten Länder werden alle zwei Jahre aktualisiert, bei einigen Ländern findet die Aktualisierung jedoch jährlich statt, weil die Daten problemlos verfügbar sind. Esri verbreitet die Aktualisierungen über das Jahr verteilt im Vierteljahresrhythmus. Die Daten der einzelnen Länder stellen die neuesten verfügbaren Schätzungen dar. Allgemein stellen die Daten, die Esri veröffentlicht, die demografischen und wirtschaftlichen Bedingungen neun Monate vor dem Veröffentlichungsdatum dar. Weitere Informationen zu den Daten für ein bestimmtes Land erhalten Sie, wenn Sie hier klicken und dann einen Kontinent auswählen, um die Liste der verfügbaren Länder anzuzeigen.

Aufschlüsselungsmethode

Die folgende Abbildung zeigt die Beziehung zwischen dem violetten Ringpuffer-Polygon, das angereichert werden soll, und den dunkelblauen Settlement Points sowie den detaillierten statistischen Polygonen mit grauen Umrissen, auf denen die Anreicherung basiert. So reichern Sie den violetten Ring mit der Gesamtbevölkerung an:

  1. Wählen Sie die statistischen Polygone, die vollständig innerhalb des Ring-Polygons liegen, aus. Diese Polygone werden weiß dargestellt. Berechnen Sie die Summe der Gesamtbevölkerungsvariable für diese Polygone.
  2. Wählen Sie die statistischen Polygone, die sich teilweise mit dem Ring-Polygon überschneiden, aus. Sie werden hellgrün dargestellt. Führen Sie für jedes dieser Polygone die folgenden Schritte aus:
    1. Wählen Sie alle dunkelblauen Siedlungspunkte aus, die darin liegen. Bestimmen Sie mithilfe der Gesamtbevölkerungsvariable aus dem statistischen Polygon und der Summe der Wahrscheinlichkeitspunktzahlen für die Besiedlung das Verhältnis der Menschen pro Besiedlungspunktzahl-Einheit.
    2. Berechnen Sie nur für die Punkte innerhalb des violetten Rings die Summe der Besiedlungswahrscheinlichkeit, und leiten Sie daraus die Anzahl von Menschen ab, die durch diese Punkte dargestellt werden.

      Settlement Points

      Die dunkelblauen Siedlungspunkte stellen zwei Arten von Informationen dar. Zunächst gibt es ein Gitternetz aus Punkten, die im regelmäßigen Abstand von 75 Metern angeordnet sind und das wie oben beschrieben erzeugt wird. Da einige Berichterstattungseinheiten klein genug sind, und zwischen das 75-Meter-Gitternetz zu fallen, werden in einem zweiten Schritt die Schwerpunkte dieser Einheiten hinzugefügt, damit diese Bereiche nicht ausgelassen werden.

Variationen der Aufschlüsselungsmethode

Die obige Beschreibung gilt für die meisten Länder. Für die USA und Kanada jedoch gilt ein vereinfachter Prozess, da die Punkte bereits über ein Attribut mit der dort lebenden Bevölkerung verfügen. Entsprechend wird nur die Summe des Bevölkerungsattributs für die Punkte innerhalb des Anreicherungs-Polygons benötigt, um die Gesamtbevölkerung zu ermitteln. Die Werte von anderen Variablen werden basierend auf vorher berechneten Mittelwerten oder Anteilen der Bevölkerung oder Zusammenfassungen bestimmt.

In den vorstehenden Informationen wird die Standardmethode für die Aufschlüsselung beschrieben, die in der ArcGIS REST API für den GeoEnrichment-Service als BlockApportionment bezeichnet wird. Wenn der Service ein sehr großes Polygon erkennt, wird eine schnellere und weniger rechenintensive Methode angewendet. Sie wird als CentroidsInPolygon bezeichnet. Der Name der verwendeten Methode leitet sich aus den Metadaten für die Ergebnisse eines Anreicherungsvorgangs ab.

Bei der Methode "Schwerpunkte in Polygon" werden gröbere Geographien und ihre Schwerpunkte als Basis für die Aufschlüsselung verwendet. So werden beispielsweise in den USA anstelle der Blockgruppen-Polygone des US Census Bureau die Grenzen der Zählbezirke des US Census Bureau und anstelle der Block Points die Bezirksschwerpunkte als Basis für die Aufschlüsselung verwendet. Da die Größe der Polygone zunimmt, werden progressiv gröbere Polygon-Geographien und ihre Schwerpunkte von der Methode "Schwerpunkte in Polygon" verwendet. Diese Schwellenwerte basieren auf den Pufferdurchmessern:

  • In den USA werden die folgenden Durchmesser und Polygon-/Punkt-Datasets verwendet:
    • Blockgruppen und Block Points bei 0 bis 504 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 2 bei 505 bis 786 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 3 bei 787 bis 866 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 4 bei 867 bis 954 Meilen
    • Zählbezirke und Block Points basierend auf der Generalisierungsebene 5 ab 955 Meilen
  • Eine globale Liste aller Aufschlüsselungseinstellungen finden Sie in dieser Tabelle.

Deshalb ist es beim Verwalten von Daten als Eingaben für das Werkzeug Layer anreichern wichtig, große Polygone von kleineren Polygonen zu trennen.

Die Unterschiede bei den Ergebnissen mit den verschiedenen Methoden sind normalerweise sehr gering, bei den gröberen Geographien können jedoch nicht optimale Ergebnisse erzeugt werden. Der GeoEnrichment-Service verfügt über die Eigenschaft detailedAggregationMethod, in der das Überschreiben des oben beschriebenen Standardverhaltens festgelegt werden kann. Wenn jedoch detailedAggregationMethod festgelegt wurde, kann nur jeweils ein großes Polygon nach dem anderen angereichert werden.

Hinweis:

Extrem große Polygone, die die oben beschriebene Größe für die Methode "Schwerpunkte in Polygon" überschreiten, werden nicht verarbeitet. Für sie wird eine Warnung ausgegeben.

Im Gegensatz dazu können für winzige Polygone (d. h. Polygone, die kleiner als ein Gebäudeblock in einem städtischen Bereich oder kleiner als ein Quadratkilometer oder eine Quadratmeile in einem ländlichen Bereich sind), möglicherweise keine Ergebnisse generiert werden, da es keine Kreuzungen gibt oder keine Siedlungs- oder Zählblockpunkte enthalten sind.

Zusätzliche Überlegungen

Eine der häufigsten Fragen zu GeoEnrichment lautet: Wie verlässlich sind die Ergebnisse? Letztendlich hängt dies von den verfügbaren Daten für die einzelnen Länder ab. Selbst innerhalb der meisten Länder ist dies unterschiedlich, abhängig davon, ob die anzureichernde Fläche dicht oder weniger dicht bewohnt ist.

Jedes Land verfügt über zwei Zuverlässigkeitspunktzahlen. Der potenzielle Bereich liegt zwischen 1,0 (beste Bewertung) und 5,0 (schlechteste Bewertung), wobei jedoch kein Land mit einem dieser Extreme bewertet wird. Die wichtigste Punktzahl, die sich auf die Verlässlichkeit der Datenaufschlüsselung auswirkt, ist das Verhältnis zwischen der Fläche des Bevölkerungs-Polygons und der Anzahl der Menschen, die geschätzt dort leben. Wenn es sich um ein großes Polygon und nur wenige Menschen handelt, sinkt damit die Wahrscheinlichkeit, dass die Siedlungspunkte sich an bewohnten Orten überschneiden. In den meisten Ländern kommt eine Mischung der Umstände zum Tragen. Ein gutes Beispiel ist Saudi-Arabien. Die Städte dort werden durch viele Polygone für jeweils kleine Bereiche dargestellt, während die ausgedehnten Wüstenflächen nur durch einige wenige Polygone repräsentiert werden.

Eine zweite Punktzahl bezüglich der Zuverlässigkeit bezieht sich auf die Zuverlässigkeit insgesamt. Dieser Wert umfasst das Verhältnis zwischen der Polygonfläche und der Bevölkerung und eine Bewertung der Zuverlässigkeit der Volkszählungsdaten des jeweiligen Landes sowie der Komplexität des Footprints der Besiedlung. Bei der Zuverlässigkeit der Volkszählungsdaten werden das Alter der letzten offiziellen Volkszählung, die Erhebungsmethode und die Vollständigkeit dieser Volkszählung und anderer verwendeter Schätzwerte und Surveys für die Ableitung der aktuellen Schätzung berücksichtigt. Die Komplexität des Footprints ist deshalb wichtig, weil sich die Erstellung der Siedlungspunkte auf ein Raster-Modell stützt, das an den Rändern der Siedlung eine Tendenz zu niedrigeren Werte für die Besiedlungswahrscheinlichkeit zeigt. Der Grund dafür ist das Resampling.