Punkt-Cluster suchen (Map Viewer)

Das Werkzeug "Punkt-Cluster suchen" identifiziert Cluster aus Punkt-Features im Datenrauschen des Umfelds basierend auf deren räumlicher Verteilung.

Beispiele

Nachfolgend finden Sie Anwendungsbeispiele für dieses Werkzeug:

  • Eine Organisation, die eine bestimmte durch Schädlinge übertragene Krankheit untersucht, möchte ermitteln, wo im Untersuchungsgebiet mit der Behandlung und Ausrottung dieser Schädlinge begonnen werden soll. Ein Analyst verfügt über ein Punkt-Dataset, das die betroffenen und nicht betroffenen Haushalte im Untersuchungsgebiet darstellt. Mithilfe des Werkzeugs "Punkt-Cluster suchen" sucht der Analyst den größten Cluster der betroffenen Haushalte.
  • Eine Katastrophenhilfeorganisation muss herausfinden, wo sie ihre Ressourcen für die Rettung und Evakuierung nach einer Naturkatastrophe einsetzen kann. Mithilfe des Werkzeugs "Punkt-Cluster suchen" identifiziert ein Analyst verortete Tweets, in denen das Ereignis erwähnt wird. Anhand der Größe und Position dieser Cluster erstellt die Organisation eine Karte des betroffenen Gebiets und plant die Hilfsmaßnahmen.

Verwendungshinweise

Das Werkzeug "Punkt-Cluster suchen" enthält Konfigurationen für Eingabe-Features, Cluster-Einstellungen und den Ergebnis-Layer.

Eingabe-Features

Die Gruppe Eingabe-Features enthält den Parameter Eingabe-Layer, bei dem es sich um den Layer mit den Punkt-Features handelt, die basierend auf ihrer räumlichen Verteilung in Cluster gruppiert werden.

Bei Feature-Eingaben wird unter dem Layer-Namen eine Feature-Anzahl angezeigt. Die Anzahl umfasst alle Features in dem Layer mit Ausnahme von Features, die mit einem Filter entfernt wurden. Umgebungseinstellungen, beispielweise die Verarbeitungsausdehnung, werden in der Feature-Anzahl nicht berücksichtigt.

Hinweis:

Web Mercator ist keine geeignete Projektion für räumliche Analysen. Wenn "WGS 1984 Web Mercator (Auxiliary Sphere)" als Raumbezugssystem des Eingabe-Layers festgelegt wurde, werden die Daten in ein geographisches Koordinatensystem konvertiert, damit Sehnenentfernungen in der Analyse verwendet werden können.

Cluster-Einstellungen

Die Gruppe Cluster-Einstellungen enthält die folgenden Parameter:

  • Methode der Cluster-Bildung gibt die Methode an, die zum Identifizieren von Clustern verwendet wird.
    • Definierte Entfernung (DBSCAN): Identifiziert Cluster durch Suchen innerhalb einer angegebenen Suchentfernung. Diese Methode ist geeignet, wenn alle sinnvollen Cluster eine ähnliche Dichte aufweisen.
    • Automatische Anpassung (HDBSCAN): Verwendet einen Entfernungsbereich, um Cluster variierender Dichten vom schwächeren Rauschen zu trennen. Dies ist die am stärksten datengesteuerte Methode der Cluster-Bildung, sodass keine Suchentfernung benötigt wird.
    • Mehrere Maßstäbe (OPTICS): Identifiziert Cluster anhand der Entfernung zwischen Nachbarn und eines Erreichbarkeitsplots. Bei dieser Methode wird zuerst die minimale Erreichbarkeitsentfernung für alle Punkte ermittelt. Die minimale Erreichbarkeitsentfernung ist die Entfernung von einem Punkt zu seinem nächstgelegenen Nachbarn, der bei der Suche noch nicht aufgesucht wurde. Wenn die minimale Erreichbarkeitsentfernung für alle Punkte ermittelt wurde, erstellt das Werkzeug einen Erreichbarkeitsplot. Der Erreichbarkeitsplot stellt die Erreichbarkeitsreihenfolge der einzelnen Punkte und deren Erreichbarkeitsentfernung dar, sodass die Cluster-Struktur der Punkte sichtbar wird. Anschließend verwendet die Methode den Wert Cluster-Empfindlichkeit zum Identifizieren von Clustern. Ähnlich wie die HDBSCAN-Methode kann die OPTICS-Methode Cluster mit unterschiedlicher Dichte identifizieren.
  • Minimale Anzahl Punkte pro Cluster gibt an, wie viele Punkte mindestens erforderlich sind, damit eine Gruppierung von Punkten als Cluster betrachtet wird. Im Allgemeinen gilt, dass je kleiner der Wert ist, desto mehr Cluster erkannt werden. Dieser Wert muss kleiner als oder gleich der Anzahl von Punkten im Layer sein. Der unterstützte Minimalwert lautet 2.
  • Suchentfernung gibt die maximale Entfernung um jeden Punkt an, der berücksichtigt wird. Wenn der Wert Methode der Cluster-Bildung auf Definierte Entfernung (DBSCAN) festgelegt ist, entspricht der Wert Suchentfernung der maximalen Entfernung um jedes Punkt-Feature im Cluster, in der nach Punkten gesucht wird, die in den Cluster aufgenommen werden können. Wenn die Mindestanzahl von Punkten innerhalb der Suchentfernung von einem bestimmten Punkt gefunden werden kann, wird dieser Punkt als Kernpunkt betrachtet. Wird die Mindestanzahl von Punkten nicht innerhalb der Suchentfernung von einem bestimmten Punkt gefunden und liegt dieser Punkt aber innerhalb der Suchentfernung von einem Kernpunkt, wird der Punkt als Grenzpunkt angesehen. Cluster bestehen sowohl aus Kernpunkten als auch aus Grenzpunkten. Wenn der Wert Methode der Cluster-Bildung auf Mehrere Maßstäbe (OPTICS) festgelegt ist, entspricht die Suchentfernung der maximalen Entfernung um die einzelnen Punkte, in der nach Punkten gesucht wird, um ihnen eine Erreichbarkeitsentfernung zuzuweisen. Die Erreichbarkeitsentfernung ist die Entfernung von einem Punkt zu seinem nächstgelegenen Nachbarn, der bei der Suche noch nicht aufgesucht wurde. Punkten innerhalb der Kernentfernung wird die Kernentfernung als ihre Erreichbarkeitsentfernung zugewiesen. Die Kernentfernung eines Punktes ist eine Messung der Entfernung, die von jedem einzelnen Punkt zur definierten minimalen Anzahl von Features zurückgelegt werden muss.
  • Einheit für Suchentfernung gibt die Einheiten für den Wert Suchentfernung an.
  • Zeitfeld ist das Feld des Eingabe-Layers, das für jedes Feature einen Zeitstempel enthält. Dieser Parameter ist verfügbar, wenn der Wert Methode der Cluster-Bildung auf Definierte Entfernung (DBSCAN) oder Mehrere Maßstäbe (OPTICS) festgelegt ist. Wenn im Zeitfeld ein Wert angegeben ist, müssen Sie auch für Suchentfernung und Einheit für Suchentfernung angeben.
  • Suchzeitintervall ist das Zeitintervall, das verwendet wird, um zu bestimmen, ob Features ein Raum-Zeit-Cluster bilden. Das Suchzeitintervall reicht vom Zeitpunkt vor bis zum Zeitpunkt nach dem Zeitpunkt der einzelnen Features. Ein Suchzeitintervall von 3 Tagen um ein Feature enthält beispielsweise alle Features, die 3 Tage vor dem Zeitpunkt des Features beginnen und 3 Tage danach enden.
  • Einheit für Suchzeit ist die Einheit für das Suchzeitintervall.
  • Mit Cluster-Empfindlichkeit wird festgelegt, wie Cluster anhand der Form (Neigung und Höhe) von Spitzen innerhalb des Erreichbarkeitsplots getrennt werden. Der Erreichbarkeitsplot stellt die Erreichbarkeitsreihenfolge der Punkte und deren Erreichbarkeitsentfernung dar. Bei einer sehr hohen Cluster-Empfindlichkeit (nahe 100) werden selbst die kleinsten Spitzen im Erreichbarkeitsplot als Trennung zwischen Clustern behandelt. Bei einer sehr geringen Cluster-Empfindlichkeit (nahe 0) werden nur die steilsten höchsten Spitzen im Erreichbarkeitsplot als Trennung zwischen Clustern behandelt. Wenn die Option leer gelassen wird, wird der Wert für die Cluster-Empfindlichkeit mithilfe von Kullback-Leibler Divergenz berechnet.

Ergebnis-Layer

Die Gruppe Ergebnis-Layer enthält die folgenden Parameter:

  • Ausgabe-Name gibt den Namen des Layers an, der erstellt und der Karte hinzugefügt wird. Der Name muss eindeutig sein. Wenn in der Organisation bereits ein Layer mit dem gleichen Namen vorhanden ist, tritt ein Fehler auf, und Sie werden aufgefordert, einen anderen Namen zu verwenden.
  • In Ordner speichern gibt den Namen eines Ordners in Eigene Inhalte an, in dem das Ergebnis gespeichert wird.

Umgebungen

Umgebungseinstellungen für die Analyse sind zusätzliche Parameter, mit denen die Ergebnisse eines Werkzeugs beeinflusst werden können. Sie können über die Parametergruppe Umgebungseinstellungen auf die Umgebungseinstellungen des Werkzeugs für die Analyse zugreifen.

Dieses Werkzeug berücksichtigt die folgenden Analyseumgebungen:

  • Ausgabe-Koordinatensystem
  • Verarbeitungsausdehnung
    Hinweis:

    Die standardmäßige Verarbeitungsausdehnung in Map Viewer ist Volle Ausdehnung. Diese Standardeinstellung unterscheidet sich von Map Viewer Classic, wo Aktuelle Kartenausdehnung verwenden standardmäßig aktiviert ist.

Credits

Dieses Werkzeug verbraucht Credits.

Verwenden Sie Credit-Anzahl schätzen, um die Anzahl der Credits zu berechnen, die zum Ausführen des Werkzeugs erforderlich sind. Weitere Informationen finden Sie unter Informationen zu Credits für räumliche Analysen.

Ausgaben

Das Werkzeug gibt einen Punkt-Layer aus. Wenn der Parameter Methode der Cluster-Bildung auf den Wert Automatische Anpassung (HDBSCAN) oder Mehrere Maßstäbe (OPTICS) festgelegt wurde, gibt das Werkzeug auch ein Diagramm aus. Der Ausgabe-Layer aller Optionen für Methode der Cluster-Bildung enthält die Felder Cluster ID, Source ID und Color ID. Das Feld Cluster ID identifiziert den Cluster, dem jeder Punkt angehört. Rauschpunkte haben den Wert -1. Der Wert des Feldes Source ID ist eine eindeutige Kennung. Der Wert des Feldes Color ID stellt die einem Punkt und seinem Cluster zugewiesene Farbe dar. Enthält der Ausgabe-Layer mehr als neun Cluster, werden jeder Farbe mehrere Cluster zugewiesen. Benachbarten Clustern werden jedoch unterschiedliche Farben zugewiesen, damit sie optisch voneinander unterschieden werden können. Wenn der Wert des Parameters Methode der Cluster-Bildung auf Automatische Anpassung (HDBSCAN) festgelegt ist, enthält der Ausgabe-Punkt-Layer die folgenden zusätzlichen Felder:

  • Probability ist ein Wert zwischen 0 und 1, der die Wahrscheinlichkeit angibt, dass ein Punkt dem zugewiesenen Cluster angehört. Rauschpunkte haben den Wert 0.
  • Outlier ist ein Wert zwischen 0 und 1, der angibt, ob ein Punkt ein Ausreißer innerhalb seines eigenen Clusters sein kann. Die Rauschpunkte werden als "Single Cluster" angesehen. Je höher der Wert weist, umso wahrscheinlicher ist der Punkt ein Ausreißer.
  • Exemplar ist ein Wert zwischen 0 und 1, der angibt, ob ein Punkt für sein Cluster am repräsentativsten ist.
  • Stability ist ein Wert, der das Vorhandensein der einzelnen Cluster in einem Maßstabsbereich wiedergibt. Je größer der Wert, umso größer ist der Bereich der Abstandsmaßstäbe, in dem sich der Cluster befindet.

Wenn der Wert des Parameters Methode der Cluster-Bildung auf Mehrere Maßstäbe (OPTICS) festgelegt ist, enthält der Ausgabe-Layer die folgenden zusätzlichen Felder:

  • Reachability order gibt an, wie die Eingabe-Features für die Analyse angeordnet wurden.
  • Reachability distance ist die Entfernung zwischen jedem Punkt und seinem nächstgelegenen nicht aufgesuchten Nachbarn.

Wenn der Parameter Methode der Cluster-Bildung auf den Wert Automatische Anpassung (HDBSCAN) oder Mehrere Maßstäbe (OPTICS) festgelegt wurde, gibt das Werkzeug ein Diagramm aus. Bei Mehrere Maßstäbe (OPTICS) wird ein Erreichbarkeitsplot ausgegeben, der zum Auswerten der Dichte der einzelnen Cluster verwendet werden kann. Bei Automatische Anpassung (HDBSCAN) wird ein Diagramm der Verteilung der Mitgliedschaftswahrscheinlichkeit ausgegeben, in dem die Verteilung der Wahrscheinlichkeit, mit der ein Feature zum zugewiesenen Cluster gehört, angezeigt wird. Um dieses Diagramm anzuzeigen, klicken Sie auf der Werkzeugleiste Inhalt auf Diagramme.

Wenn im Zeitfeld ein Wert angegeben ist, enthält die Ausgabe das Diagramm "Zeitspanne pro Cluster", in dem die Zeitspanne der einzelnen Raum-Zeit-Cluster angezeigt wird. Um dieses Diagramm anzuzeigen, klicken Sie auf der Werkzeugleiste Inhalt auf Diagramme. Der Ausgabe-Layer enthält zudem die folgenden Felder, in denen die Zeitspanne des Clusters zusammengefasst werden, zu dem die einzelnen Punkte gehören:

  • Startzeit ist die Startzeit des Clusters, zu dem das Feature gehört.
  • Endzeit ist die Endzeit des Clusters, zu dem das Feature gehört.
  • Durchschnittszeit ist die Durchschnittszeit des Clusters, zu dem das Feature gehört.
  • Zeitüberschreitung
Sie können diese Felder verwenden, um die Raum-Zeit-Cluster über die Zeit zu visualisieren, indem Sie die Zeiteigenschaften für den Layer aktivieren und anschließend den Zeitschieberegler in Map Viewer verwenden. Um die Zeiteigenschaften für den Layer zu aktivieren, klicken Sie auf der Werkzeugleiste Inhalt auf Layer. Klicken Sie auf den Layer. Klicken Sie auf der Werkzeugleiste Einstellungen auf Eigenschaften. Blenden Sie das Dropdown-Menü Informationen ein. Klicken Sie auf den Layer unter Quell-Layer. Damit wird die Elementseite des Layers geöffnet. Klicken Sie auf der Registerkarte Übersicht unter Zeiteinstellungen auf Bearbeiten. Das Fenster Zeiteinstellungen wird angezeigt. Aktivieren Sie das Kontrollkästchen Zeiteigenschaften aktivieren. Wählen Sie Bestimmte Ereignisse im Zeitverlauf und dann Durchschnittszeit für das Zeitfeld aus.

Klicken Sie auf der Werkzeugleiste Einstellungen auf Analyse Analyse, um weitere Details zur Analyse anzuzeigen. Klicken Sie auf Verlauf, suchen Sie die erfolgreiche Ausführung des Werkzeugs, und klicken Sie darauf. Die Analysedetails werden auf der Registerkarte Ergebnisse geöffnet. Die Registerkarte Ergebnisse enthält nun zusätzliche Details zur Analyse. Sie können diese zusätzlichen Analysedetails auch auf der Elementseite des Layers einsehen. Klicken Sie auf die Schaltfläche "Optionen" neben dem Ausgabe-Layer, und klicken Sie auf Details anzeigen.

Lizenzanforderungen

Für dieses Werkzeug werden der folgende Benutzertyp und die folgenden Konfigurationen benötigt:

  • Benutzertyp Creator, Professional oder Professional Plus
  • Publisher-, Vermittler- oder Administratorrolle oder eine entsprechende benutzerdefinierte Rolle

Ressourcen

Weitere Informationen finden Sie in den folgenden Quellen: