Funktionsweise der Ähnlichkeitssuche

Mit dem Werkzeug Ähnlichkeitssuche werden die Kandidaten-Features identifiziert, die einem oder mehreren abzugleichenden Eingabe-Features am ähnlichsten (oder unähnlichsten) sind. Ähnlichkeit basiert auf einer angegebenen Liste von numerischen Attributen (Interessenattribute). Wenn mehr als ein Feature für Abzugleichende Eingabe-Features angegeben wird, basiert die Ähnlichkeit auf Durchschnittswerten für jedes der Interessenattribute. Die Ausgabe-Feature-Class (Ausgabe-Features) enthält die Features für Abzugleichende Eingabe-Features sowie alle übereinstimmenden Feature-Kandidaten, die gefunden wurden, nach Ähnlichkeit geordnet (wie mit dem Parameter Größte oder geringste Ähnlichkeit angegeben). Die Anzahl der zurückgegebenen Treffer hängt vom Wert des Parameters Anzahl der Ergebnisse ab.

Potenzielle Anwendungsbereiche

  • Mit dem Werkzeug Ähnlichkeitssuche können Sie andere Städte suchen, die in puncto Bevölkerung, Bildung und Nähe zu bestimmten Freizeiteinrichtungen Ähnlichkeiten mit Ihrer eigenen Stadt aufweisen.
  • Lokale Behörden können ihre Stadt bei potenziellen Unternehmen bewerben, um die Steuereinnahmen zu erhöhen. Das Werkzeug Ähnlichkeitssuche unterstützt sie dabei, andere Städte zu suchen, die Ähnlichkeiten mit ihrer eigenen aufweisen, sodass mithilfe von Attraktivitätsattributen ein Vergleich möglich ist (z. B. niedrige Kriminalitätsrate und hohes Wachstum). Diese Behörden sind möglicherweise auch daran interessiert, ähnliche Orte zu finden, die entweder größer oder kleiner sind (Kosinusähnlichkeit). Die Ähnlichkeit mit kleineren oder größeren Orten, die für infrage kommende Unternehmen attraktiv sind, ermöglicht es ihnen, die Ähnlichkeiten hervorzuheben und gleichzeitig die Vorteile herauszustellen, die sich daraus ergeben, dass die Stadt kleiner oder größer ist (weniger Verkehrsstaus und Kleinstadt-Flair einerseits oder mehr potenzielle Kunden andererseits). Diese Behörden sind möglicherweise auch an Städten interessiert, von denen sie sich am meisten unterscheiden. Wenn einer der Orte mit den größten Unterschieden Konkurrenz für die Unternehmen, die Sie anziehen möchten, darstellt, erhalten sie mit dieser Analyse Informationen, die sie zur Präsentation eines Vergleichs benötigen.
  • Ein Personalmanagerin möchte in der Lage sein, die Gehaltsstufen im Unternehmen zu rechtfertigen. Nachdem sie Städte gefunden hat, die eine ähnliche Größe, ähnliche Lebenshaltungskosten und ähnliche Umgebung aufweisen, kann sie die Gehaltsstufen für diese Städte untersuchen, um festzustellen, ob sie ebenfalls ähnlich sind.
  • Ein für die Kriminalitätsanalyse zuständiger Mitarbeiter möchte die Datenbank durchsuchen, um festzustellen, ob ein Verbrechen Teil eines umfassenderen Musters oder Trends ist.
  • Ein Freizeitfitnessprogramm für Kinder war in Stadt A sehr erfolgreich. Die Befürworter möchten andere Städte mit ähnlichen Eigenschaften als Kandidaten für eine Ausweitung des Programms ermitteln.
  • Eine Strafverfolgungsbehörde hat Gebiete entdeckt, in denen Drogen angebaut oder hergestellt werden. Die Identifizierung von Orten mit ähnlichen Eigenschaften kann dabei helfen, zukünftige Suchen zu planen.
  • Ein großes Einzelhandelsunternehmen verfügt über mehrere erfolgreiche und einige wenige nicht erfolgreiche Geschäfte. Durch die Suche nach Standorten mit ähnlichen demografischen und Umfeldeigenschaften (Erreichbarkeit, Sichtbarkeit, ergänzende Geschäfte usw.) können die besten Standorte für ein neues Geschäft gefunden werden.

Abgleichmethoden

Der Abgleich kann auf Attributwerten, Attributwerten in einer Rangfolge oder Attributprofilen (Kosinusähnlichkeit) beruhen. Die für diese Methoden eingesetzten Algorithmen werden nachfolgend beschrieben. Für alle Methoden gilt, dass bei mehr als einem Feature für Abzugleichende Eingabe-Features der Durchschnitt für die Attribute für alle Features errechnet wird, um ein zusammengesetztes Ziel-Feature zur Verwendung für den Abgleichprozess zu erstellen: Durchschnittliche Interessenattribute

Attributwerte

. Danach werden für jeden Kandidaten die standardisierten Werte von denen des Ziels subtrahiert, die Differenz quadriert und die quadrierten Differenzen addiert. Diese Summe wird zum Ähnlichkeitsindex für den Kandidaten. Nachdem alle Kandidaten verarbeitet wurden, werden die Kandidaten vom kleinsten Index (größte Ähnlichkeit) bis hin zum größten Index (geringste Ähnlichkeit) sortiert.

Detailinformationen:

Die Standardisierung der Attributwerte umfasst eine Z-Transformation, wobei jeder Wert vom Mittelwert für alle Werte subtrahiert und durch die Standardabweichung für alle Werte dividiert wird (Abzugleichende Eingabe-Features und Kandidaten-Features werden in die Mittelwert- und Standardabweichungsberechnungen einbezogen). Bei der Standardisierung werden alle Attribute in denselben Maßstab überführt, auch wenn sie von sehr unterschiedlichen Zahlentypen dargestellt werden: Verhältnisse (Zahlen von 0 bis 1,0), Bevölkerung (mit Werten von über einer Million) und Entfernungen (z. B. Kilometer).

Attributwerte in einer Rangfolge

.Daraufhin wird für jeden Kandidaten die quadrierte Differenz für jedes Attribut in Relation zum Ziel-Feature summiert. Wenn der Bevölkerungswert für das Ziel der zehntgrößte unter allen Kandidaten ist und die Bevölkerung für den betreffenden Kandidaten die fünfzehntgrößte, würde die Summe der quadrierten Rangdifferenz der Bevölkerung für diesen Kandidaten 10 - 15 = -5 und -5**2 gleich 25 betragen. Die Summe der quadrierten Rangdifferenzen für alle Interessenattribute ist der Ähnlichkeitsindex für diesen Kandidaten. Nachdem alle Kandidaten verarbeitet wurden, werden die Kandidaten vom kleinsten Index (größte Ähnlichkeit) bis hin zum größten Index (geringste Ähnlichkeit) sortiert.

Attributprofile

Daraufhin wird Kosinusähnlichkeitsmathematik verwendet, um den Vektor von standardisierten Attributen für jeden Kandidaten mit dem Vektor von standardisierten Attributen für das abzugleichende Ziel-Feature zu vergleichen. Die Kosinusähnlichkeit der zwei Vektoren A und B wird folgendermaßen berechnet:

Kosinusähnlichkeitsgleichung

Die Kosinusähnlichkeit ist nicht mit dem Abgleich von Attributgrößen befasst. Diese Methode beschäftigt sich stattdessen mit den Beziehungen zwischen den Attributen. Wenn Sie ein Profil (Liniendiagramm) der standardisierten Attribute in den zu vergleichenden Vektoren (das Ziel und einer der Kandidaten) erstellt haben, werden möglicherweise sehr ähnliche oder sehr unterschiedliche Profile angezeigt:

Attributprofile
Die Profile für das oberste Attributpaar sind sehr ähnlich, die Profile für das unterste Paar sehr unterschiedlich.

Der Index der Kosinusähnlichkeit reicht von 1,0 (vollständige Ähnlichkeit) bis -1,0 (vollständige Unähnlichkeit) und wird im Feld SIMINDEX (Kosinusähnlichkeit) angegeben. Diese Ähnlichkeitsmethode wird verwendet, um Orte zu finden, die über dieselben Eigenschaften verfügen, möglicherweise jedoch in einem größeren oder geringeren Umfang.

Empfehlungen

Zuordnen von Ähnlichkeitsmustern

Wenn Sie den Parameter Anzahl der Ergebnisse auf Null setzen, ordnet das Werkzeug alle Kandidaten-Features in eine Rangfolge. Die Ausgabe für diese Analyse zeigt das räumliche Muster für die Ähnlichkeit. Beachten Sie, dass Sie Informationen über Ähnlichkeiten und Unterschiede erhalten, wenn Sie alle Kandidaten in eine Rangfolge ordnen.

Karte der Ähnlichkeitsränge

Mit räumlichen Variablen

Angenommen, Sie kennen die Orte (Polygonflächen), an denen eine bestimmte gefährdete Art sich gut entwickelt, und Sie möchten andere Orte finden, wo sie ebenfalls erfolgreich leben kann. In diesem Fall suchen Sie nach Orten, die den erfolgreichen Lebensräumen ähnlich sind, Sie benötigen jedoch auch Orte, die groß und kompakt genug sind, um das Überleben der Art zu gewährleisten. Für diese Analyse können Sie eine Kompaktheitsmetrik für jede Polygonfläche berechnen (allgemeine Kompaktheitsmesswerte basieren auf der Fläche eines Polygons in Relation zu der Fläche eines Kreises mit demselben Umfang). Sie können dem Parameter An Ausgabe anzuhängende Felder dann den Kompaktheitsmesswert und ein Attribut, das die Polygongröße darstellt (Shape_Area) hinzufügen, wenn Sie das Werkzeug Ähnlichkeitssuche ausführen. Die Sortierung der ersten zehn Treffer bezüglich Kompaktheit und Fläche erleichtern die Ermittlung der Orte, die am besten für die Neuansiedlung der Art geeignet sind.

Angenommen, Sie sind ein Einzelhändler, der expandieren möchte. Wenn Sie bereits erfolgreiche Geschäfte haben, können Sie mit Attributen, die die wichtigsten Erfolgseigenschaften wiedergeben, potenzielle Standorte für eine Expansion ermitteln. Es wird davon ausgegangen, dass die vertriebenen Produkte vor allem bei Studenten beliebt sind und Sie Standorte in der Nähe Ihrer aktuellen Geschäfte oder Wettbewerber vermeiden möchten. In diesem Fall sollten Sie vor dem Werkzeug Ähnlichkeitssuche das Werkzeug Near ausführen, um räumliche Variablen zu erstellen: Entfernung zu Universitäten oder Orten mit einer höheren Dichte von Universitätsstudenten und einer großen Entfernung zu vorhandenen Geschäften und Wettbewerbern. Daraufhin können Sie diese räumlichen Variablen zum Parameter An Ausgabe anzuhängende Felder hinzufügen, wenn Sie das Werkzeug Ähnlichkeitssuche ausführen.