Verfügbar in Big-Data-Analysen.
Das Werkzeug "Ähnliche Positionen suchen" identifiziert die Kandidaten-Features, die basierend auf Feature-Attributen die größte oder geringste Ähnlichkeit mit einem oder mehreren Referenz-Features aufweisen.
Workflow-Diagramm
Beispiele
Im Folgenden sehen Sie Beispiele für die Verwendung des Werkzeugs "Ähnliche Positionen suchen":
- Bestimmen Sie basierend auf der Beziehung zwischen numerischen Attributwerten, welche Ihrer Produktionsanlagen die größte Ähnlichkeit mit Ihrer produktivsten Anlage aufweist.
- Ein für die Kriminalitätsanalyse zuständiger Mitarbeiter möchte eine Datenbank sämtlicher Straftaten durchsuchen, um festzustellen, ob eine aktuelle Straftat Teil eines umfassenderen Musters oder Trends ist.
- Bestimmen Sie basierend auf den Merkmalen der Ortschaften, die am schwersten von einer Krankheit getroffen wurden, weitere Orte, die einer hohen Krankheitsgefahr ausgesetzt sind.
Verwendungshinweise
Beachten Sie beim Arbeiten mit dem Werkzeug "Ähnliche Positionen suchen" Folgendes:
- Es können Tabellen-, Punkt-, Polylinien- oder Polygon-Features verwendet werden.
- Es sind Such-(Kandidaten-)Features erforderlich, die nach Ähnlichkeit oder Unähnlichkeit mit den Referenzpositionen geordnet werden.
- Es werden maximal 10.000 Such-Layer-Features zurückgegeben.
- Wenn mehrere Features im Parameter Ziel-Layer (Referenzpositions-Features) vorhanden sind, basiert der Abgleich auf Durchschnittswerten der Referenz-Features. Wenn beispielsweise zwei Referenz-Features vorhanden sind und eines der Analysefeld-Attribute eine Bevölkerungsvariable ist, sucht das Werkzeug im Parameter Join-Layer (Such-Kandidaten-Features) den Wert mit Bevölkerungen, die den durchschnittlichen Bevölkerungswerten ähnlich sind. Wenn die Bevölkerungswerte 100 und 102 betragen, sucht das Werkzeug beispielsweise nach Kandidaten mit Bevölkerungswerten, die dem Wert 101 nahe kommen.
Hinweis:
Wenn mehrere Features im Parameter Ziel-Layer (Referenzpositions-Features) vorhanden sind, dann wählen Sie für Attribute mit ähnlichen Werten Basis für Ähnlichkeiten (Analysefelder) aus. Wenn ein Bevölkerungswert für eines der Features 100 und der andere 100.000 beträgt, sucht das Werkzeug nach Übereinstimmungen mit Bevölkerungszahlen, die dem Durchschnitt dieser beiden Werte nahe kommen: 50.050. Dieser Durchschnittswert ist weit von dem Bevölkerungswert beider Layer entfernt.
- Verwenden Sie den Parameter Ähnlichkeit, um nach Features zu suchen, die gegenüber den Referenz-Features die größte oder die geringste Ähnlichkeit aufweisen; wählen Sie hierzu die Option Größte Ähnlichkeit oder Geringste Ähnlichkeit aus. In einigen Fällen möchten Sie möglicherweise beides anzeigen. Wenn Sie den Wert 3 für den Parameter Ähnlichkeit verwenden und für den Parameter Ähnlichkeit Größte und geringste Ähnlichkeit auswählen, gibt das Werkzeug beispielsweise die drei Kandidaten-Features mit der größten Ähnlichkeit und die drei Kandidaten-Features mit der geringsten Ähnlichkeit aus.
- Jede in der Ausgabe angegebene Lösungsentsprechung ist eine Lösung, die mit den Referenz-Features entweder die größte Ähnlichkeit oder die geringste Ähnlichkeit aufweist. Eine einzelne Lösung kann nicht beides sein (und Lösungsentsprechungen werden in den Ausgabe-Features nicht dupliziert). Wenn Sie für den Parameter Ähnlichkeit den Wert Größte und geringste Ähnlichkeit verwenden, entspricht die maximale Anzahl möglicher resultierender Übereinstimmungen (Anzahl der Ergebnisse) demzufolge der Hälfte der Anzahl des Join-Layers.
- Die beiden Optionen für den Parameter Abgleichmethode sind:
- Attributwerte: Die ähnlichsten Kandidaten weisen die kleinste Summe der quadrierten Differenzen für alle Attribute der Analysefelder auf. Alle Werte werden standardisiert, bevor die Unterschiede berechnet werden.
- Attributprofile: Die Kosinusähnlichkeit wird gemessen. Die Kosinusähnlichkeit sucht nach den gleichen Beziehungen zwischen standardisierten Attributwerten, anstatt Werte abzugleichen. Beispiel: Angenommen, es gibt die drei Analysefelder namens A1, A2 und A3. A2 ist zweimal so groß wie A1, und A3 ist fast identisch mit A2. Bei der Option Attributprofile für den Parameter Abgleichmethode sucht das Werkzeug nach Kandidaten mit diesen Attributbeziehungen: A2 ist zweimal so groß wie A1 und A3 ist fast identisch mit A2. Da diese Methode nach Beziehungen zwischen Attributen sucht, müssen Sie mindestens zwei Attribute für Analysefelder angeben. Sie können die Methode der Kosinusähnlichkeit (Option Attributprofile) verwenden, um Orte wie Los Angeles zu suchen, insgesamt jedoch in einem kleineren Maßstab. Beispiel: Das Profil der Bevölkerung im Vergleich mit der Anzahl von Autos und der Anzahl der Einwohner unter 20 Jahren. Der Index der Kosinusähnlichkeit reicht von 1,0 (vollständige Ähnlichkeit) bis -1,0 (vollständige Unähnlichkeit). Der Index der Kosinusähnlichkeit wird in das Feld simindex des Ausgabe-Features eingetragen.
- Der Parameter Basis für Ähnlichkeiten muss numerisch sein und sowohl in den Referenzpositions-Features (Ziel-Layer) als auch in den Such-(Kandidaten-)Datasets mit dem gleichen Feldnamen und Feldtyp vorhanden sein. Wenn das Werkzeug keine entsprechenden Felder für die Such-Kandidaten-Features (Join-Layer) findet, wird eine Validierungswarnung angezeigt, die darauf hinweist, dass identische Feldnamen vorhanden sein müssen.
- Alle für den Abgleich herangezogenen Attribute werden in die Ausgabe übernommen. Mit dem Parameter Felder anhängen können Sie Felder angeben, die der Ausgabetabelle hinzugefügt werden sollen. Standardmäßig werden alle Felder hinzugefügt. Mit dem Parameter Felder anhängen können Sie bestimmte Felder aus dem Join-Layer auswählen, die Sie hinzufügen möchten.
Parameter
Nachfolgend werden die Parameter für das Werkzeug "Ähnliche Positionen suchen" beschrieben:
Parameter | Beschreibung | Datentyp |
---|---|---|
Ziel-Layer (Referenzpositions-Features) | Der Ziel-Layer, der die Referenz-Features enthält. Die Referenz-Features können mit den Parametern Ausdruck von Referenzpositionen oder Ausdehnung von Referenzpositionen (siehe unten) weiter reduziert oder gefiltert werden. | Features |
Join-Layer (Such-Kandidaten-Features) | Der Join-Layer, der die Such- oder Kandidaten-Features enthält. Das Werkzeug wertet die Such-Features aus, um die Such-Features zu finden, deren Analysefeld-Attributwerte denen im Parameter Ziel-Layer (Referenz-Features) ähneln. | Features |
Ausdruck von Referenzpositionen | Ein Arcade-Attributausdruck, der ausgewertet wird, um den Ziel-Layer (Referenz-Features), der beibehalten werden soll, zu filtern. Der Ausdruck wird im Arcade-Ausdruck-Baukasten konfiguriert, indem Sie auf Arcade-Ausdruck konfigurieren klicken. Jeder Datensatz wird ausgewertet. Mit "true" ausgewertete Datensätze werden beibehalten, während mit "false" ausgewertete Datensätze verworfen werden. | Zeichenfolge (Arcade-Ausdruck) |
Ausdehnung von Referenzpositionen | Geben Sie optional eine Ausdehnung zum Filtern der Referenzpositionen an. Es werden nur Referenz-Features, die sich innerhalb der für den Parameter angegebenen räumlichen Referenzausdehnung befinden, als Referenz-Features beibehalten. In der Werkzeugkonfiguration ist eine Komponente vorhanden, die die Ausdehnungsauswahl durch das Zeichnen der Ausdehnung von Referenzpositionen ermöglicht. | EsriJSON-Envelope |
Ähnlichkeit basiert auf | Gibt mindestens ein gewünschtes numerisches Attribut (Analysefelder) an. Die für diese Attributfelder vorhandenen Werte werden für den Wert des Parameters Ziel-Layer (Referenzpositions-Features) berechnet. Anschließend werden die Features aus dem Parameter Join-Layer (Such-Kandidaten-Features) ausgewertet, um zu bestimmen, welche Such-Features die größte oder die geringste Ähnlichkeit zu den Referenz-Features aufweisen. | Zeichenfolge (Feldnamen) |
Ähnlichkeit | Gibt an, ob die Ergebnisse, die von diesem Werkzeug zurückgegeben werden, die größte oder geringste Ähnlichkeit mit dem Wert des Parameters Ziel-Layer (Referenzpositions-Features), der für die festgelegten Analysefelder angegeben wurde, aufweisen sollen. Es können maximal 10.000 Ergebnisse zurückgegeben werden. Sie können die Option Ähnlich, Geringste Ähnlichkeit oder Größte und geringste Ähnlichkeit auswählen, um Features zurückzugeben.. | Ganze Zahl und Zeichenfolge |
Abgleichmethode | Zwei Abgleichmethoden sind verfügbar:
| Zeichenfolge |
Felder anhängen | Alle für den Abgleich herangezogenen Attribute werden in die Ausgabe übernommen. Mit dem Parameter Felder anhängen können Sie bestimmte Felder angeben, die der Ausgabetabelle hinzugefügt werden sollen. Standardmäßig werden alle Felder hinzugefügt. Mit dem Parameter Felder anhängen können Sie bestimmte Felder aus dem Parameter Join-Layer (Such-Kandidaten-Features) auswählen, die Sie hinzufügen möchten. | Zeichenfolge (Feldnamen) |
Referenz-ID-Feld (optional) | Das Feld, das eindeutige IDs im Schema Ziel-Layer (Referenzpositions-Features) enthält. Wenn kein Feld ausgewählt wurde, generiert das Werkzeug eindeutige IDs für die Features. | Zeichenfolge (Feldname) |
Kandidaten-ID-Feld (optional) | Das Feld, das eindeutige IDs im Schema Join-Layer (Such-Kandidaten-Features) enthält. Wenn kein Feld ausgewählt wurde, generiert das Werkzeug eindeutige IDs für die Features. | Zeichenfolge (Feldname) |
Ausgabe-Layer
Alle Features im Parameter Ziel-Layer (Referenzpositions-Features) und Übereinstimmungen im Join-Layer (Such-Kandidaten-Features) werden zusammen mit den Attributen aus den Parametern Basis für Ähnlichkeiten und Felder anhängen in die Ausgabe-Features übernommen. Zudem werden folgende Felder in die Ausgabe-Features eingefügt:
Feldname | Beschreibung | Hinweise |
---|---|---|
location_type | Eine Zeichenfolge, die angibt, ob Features aus dem Ziel-Layer (Referenz-Features) oder dem Join-Layer (Such-/Kandidaten-Features) stammen. | |
simrank | Wenn Sie Größte Ähnlichkeit oder Größte oder geringste Ähnlichkeit für den Parameter Ähnlichkeit auswählen, werden alle Lösungsentsprechungen von der größten bis zur geringsten Ähnlichkeit geordnet. Die Lösungsentsprechung mit der größten Ähnlichkeit hat einen Rangwert von 1. | Dieses Feld wird nur dann in die Ausgabe-Features eingefügt, wenn Sie Geringste Ähnlichkeit oder Größte oder geringste Ähnlichkeit für den Parameter Ähnlichkeit auswählen. |
dissimrank | Wenn Sie Geringste Ähnlichkeit oder Größte oder geringste Ähnlichkeit für den Parameter Ähnlichkeit auswählen, werden alle Lösungsentsprechungen von der geringsten bis zur größten Ähnlichkeit geordnet. Die Auflösung mit der geringsten Ähnlichkeit erhält einen Rangstufenwert von 1. | Dieses Feld wird nur dann in die Ausgabe-Features eingefügt, wenn Sie Geringste Ähnlichkeit oder Größte oder geringste Ähnlichkeit für den Parameter Ähnlichkeit auswählen. |
simindex | Dieses Feld bestimmt die Ähnlichkeit jeder Lösungsentsprechung mit den Ziel-Referenz-Features. Wenn Sie Attributwerte als Parameterwert für Abgleichmethode angeben, stellt der Wert die Summe der quadrierten Wertunterschiede dar. | Das erste Feld wird nur dann in die Ausgabe-Features eingefügt, wenn Sie Attributwerte für den Parameter Abgleichmethode auswählen. |
cosimindex | Dieses Feld bestimmt die Ähnlichkeit jeder Lösungsentsprechung mit den Ziel-Features. Wenn Sie für die Abgleichmethode die Option Attributprofile angeben, stellt dieser Wert die Kosinusähnlichkeit dar. | Das erste Feld wird nur dann in die Ausgabe-Features eingefügt, wenn Sie Attributprofile für den Parameter Abgleichmethode auswählen. |
labelrank | Dieses Feld dient lediglich zu Anzeigezwecken. Das Werkzeug verwendet dieses Feld, um das Standard-Rendering der Analyseergebnisse bereitzustellen. | |
reference_id | Ein eindeutiger ID-Wert für Ziel-Referenz-Features. Join-Such-(Kandidaten-)Features erhalten einen NULL-Wert. Wenn der Parameter Referenz-ID-Feld nicht angegeben wurde, wird eine eindeutige ID für Referenz-Features generiert. | |
search_id | Ein eindeutiger ID-Wert für Join-Such-(Kandidaten-)Features. Ziel-Referenz-Features erhalten einen NULL-Wert. Wenn der Parameter Kandidaten-ID-Feld nicht angegeben wurde, wird eine eindeutige ID für Kandidaten- oder Such-Features generiert. |