Rechercher des localisations similaires (GeoAnalytics Desktop)—ArcGIS AllSource

Synthèse

Identifie les entités candidates les plus semblables (ou dissemblables) à une ou plusieurs entités en entrée en fonction d’attributs d’entités.

Illustration

Utilisation

Des entités tabulaires, ponctuelles, linéaires ou surfaciques peuvent être utilisées.
Une couche de recherche (candidate) en entrée est requise. Les entités contenues dans la couche de recherche sont classées selon leur similarité avec les emplacements (de référence) en entrée.
Si une ou plusieurs entités se trouvent dans la couche en entrée, l'appariement est effectué en calculant la moyenne des valeurs de la couche en entrée. Par exemple, s’il existe deux entités Input Layer (Couche en entrée) et que l’un des attributs Analysis Fields (Champs d’analyse) contient une variable liée à la population, l’outil va rechercher les couches de recherche (Search Layers) dont la population s’approche le plus des valeurs de population moyennes. Si les valeurs de population sont de 100 et 102, par exemple, l’outil recherche des candidats dont la population avoisine 101.
Remarque :
S’il existe plus d’une couche en entrée (Input Layer), choisissez les attributs Analysis Fields (Champs d’analyse) dont les valeurs sont les plus proches. Si, par exemple, la valeur de population de l’une des entrées est de 100 et que l’autre entrée est de 100 000, l’outil recherche des correspondances dont la population avoisine la moyenne de ces deux valeurs, à savoir 50 050. Vous remarquerez que cette moyenne ne correspond à la valeur de population d’aucune couche en entrée (Input Layer).
Utilisez le paramètre Most Or Least Similar (Les plus ou les moins similaires) pour rechercher les entités qui sont les plus similaires ou les moins similaires aux entités Input Layer (Couche en entrée) en utilisant respectivement l’option Most similar (Le plus similaire) ou Least similar (Le moins similaire). Dans certains cas, vous pouvez avoir besoin de consulter les deux paramètres. Si la valeur du paramètre Number of Results (Nombre de résultats) est égale à 3 et que la valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires) est définie sur Both (Les deux), par exemple, l’outil renvoie les trois entités candidates les plus similaires et les trois entités candidates les moins similaires.
Les solutions données dans Output Features (Entités en sortie) sont soit la solution la plus similaire, soit la moins similaire à Input Layer (Couche en entrée) cibles. Une seule solution ne peut pas être les deux à la fois (et les solutions ne sont pas dupliquées dans Output Features (Entités en sortie)). En conséquence, lorsque la valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires) est Both (Les deux), le nombre maximal de résultats possibles (Number of Results (Nombre de résultats)) correspond à la moitié du nombre de la valeur Search Layer (Couche de recherche).
Un maximum de 10 000 entités de la couche de recherche peuvent être renvoyées.
Le paramètre Match Method (Méthode d’appariement) comporte les options de valeurs suivantes :
- Attribute values (Valeurs attributaires) : les candidats les plus similaires auront la plus petite somme des différences au carré pour tous les attributs Analysis Fields (Champs d’analyse). Toutes les valeurs sont normalisées avant le calcul des différences.
- Attribute profiles (Profils attributaires) : la similarité cosinusoïdale est mesurée. La similarité cosinusoïdale recherche les relations identiques parmi les valeurs attributaires normalisées au lieu de se préoccuper de l’appariement des amplitudes des attributs. Supposons par exemple qu’il existe trois Analysis Fields (Champs d’analyse) nommés A1, A2 et A3. A2 est deux fois plus grand qu'A1 et A3 est presque identique à A2. Si la valeur du paramètre Match Method (Méthode d’appariement) est Attribute profiles (Profils attributaires), l’outil va rechercher les candidats présentant les mêmes relations attributaires : A2 deux fois plus grand qu’A1 et A3 presque égal à A2. Comme cette méthode recherche des relations entre les attributs, vous devez spécifier un minimum de deux attributs Analysis Fields (Champs d’analyse). Vous pouvez utiliser la méthode de similarité cosinusoïdale (c’est-à-dire l’option Attribute profiles (Profils attributaires)) pour trouver des sites similaires à Los Angeles, mais à une échelle différente. Par exemple, vous pouvez vous intéresser au profil de la population par rapport au nombre de voitures et au nombre d’habitants de moins de 20 ans. L'index de similarité cosinusoïdale s'étend de 1,0 (similarité parfaite) à -1,0 (dissemblance parfaite). L'index de similarité cosinusoïdale est indiqué dans le champ simindex (similarité cosinusoïdale) des Output Features (Entités en sortie).
Le paramètre Analysis Fields (Champs d’analyse) doit être numérique et présenter les mêmes nom et type de champ dans les jeux de données Input Layer (Couche en entrée) et Search Layer (Couche de recherche). Si l’outil ne trouve aucun champ correspondant pour Search Layer (Couche de recherche), un avertissement indique que les attributs manquants ont été ignorés dans l’analyse.
Tous les attributs utilisés pour l'appariement sont inscrits dans la sortie. Le paramètre Append Fields (Ajouter des champs) vous permet d’indiquer les champs à ajouter à la table en sortie. Par défaut, tous les champs sont ajoutés. Utilisez le paramètre Append Fields (Ajouter des champs) pour sélectionner des champs dans la couche de recherche (Search Layer) que vous souhaitez ajouter.

Le paramètre Input Layer (Couche en entrée) et les solutions correspondantes sont inscrits dans les entités en sortie ainsi que dans les paramètres Analysis Fields (Champs d’analyse) et Append Fields (Ajouter des champs). De plus, les champs suivants sont inclus dans les entités en sortie :


Nom du champ	Description	Remarques
location_type	Chaîne indiquant si les entités sont une couche de référence (entrée) ou une couche candidate (recherche).
simrank	Lorsque vous sélectionnez Most Similar (Le plus similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires), toutes les solutions sont classées des plus similaires aux moins similaires. La valeur de classement de la solution la plus similaire est de 1.	Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Most Similar (Le plus similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires).
dissimrank	Lorsque vous sélectionnez Least Similar (Le moins similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires), toutes les solutions sont classées des moins similaires aux plus similaires. La valeur de classement de la solution la moins similaire est de 1.	Ce champ est inclus uniquement dans les entités en sortie (Output Features) lorsque vous sélectionnez Least Similar (Le moins similaire) ou Both (Les deux) comme valeur du paramètre Most Or Least Similar (Les plus ou les moins similaires).
simindex	Ce champ quantifie la similarité de chaque solution par rapport à l'entité cible. Lorsque vous spécifiez Attribute values (Valeurs attributaires) comme valeur du paramètre Match Method (Méthode d’appariement), cette valeur représente la somme des différences des valeurs au carré. Pour en savoir plus sur le calcul de cet index, reportez-vous à la rubrique Fonctionnement de Recherche de similarités.	Ce champ est inclus uniquement dans les entités en sortie (Output Features) lorsque vous sélectionnez Attribute values (Valeurs attributaires) comme valeur du paramètre Match Method (Méthode d’appariement).
cosimindex	Ce champ quantifie la similarité de chaque solution par rapport à l'entité cible. Lorsque vous spécifiez Attribute profiles (Profils attributaires) comme valeur du paramètre Match Method (Méthode d’appariement), cette valeur représente la similarité cosinusoïdale. Pour en savoir plus sur le calcul de cet index, reportez-vous à la rubrique Fonctionnement de Recherche de similarités.	Ce champ est inclus uniquement dans les entités en sortie (Output Features) lorsque vous sélectionnez Attribute profiles (Profils attributaires) comme valeur du paramètre Match Method (Méthode d’appariement).
labelrank	Ce champ est fourni uniquement à des fins d’affichage. L'outil utilise ce champ pour fournir le rendu par défaut des résultats d'analyse.
reference_id	Valeur d’ID unique pour les entités de référence. Les entités de recherche reçoivent une valeur nulle.
search_id	Valeur d’ID unique des entités de recherche. Les entités de référence reçoivent une valeur nulle.

La classe d’entités en sortie est ajoutée automatiquement à la table des matières, le rendu par défaut étant appliqué au champ labelrank.
Vous pouvez améliorer les performances de l’outil Rechercher des emplacements similaires en suivant les conseils ci-après :
- Définissez l’environnement de l’étendue de manière à analyser uniquement des données d’intérêt.
- Sélectionnez seulement quelques entités dans la couche de référence.
- Utilisez les données locales de l’environnement de l’analyse.
Cet outil de géotraitement est mis en œuvre par Spark. L’analyse est effectuée sur votre ordinateur de bureau en utilisant plusieurs cœurs en parallèle. Pour en savoir plus sur l’exécution de l’analyse, reportez-vous à la rubrique Remarques relatives aux outils GeoAnalytics Desktop.
Lorsque vous exécutez des outils GeoAnalytics Desktop, l’analyse est effectuée sur votre ordinateur de bureau. Pour des performances optimales, les données doivent être accessibles sur votre bureau. Si vous utilisez une couche d’entités hébergée, il est recommandé d'utiliser ArcGIS GeoAnalytics Server. Si vos données ne sont pas enregistrées en local, l’exécution des outils prendra plus de temps. Pour utiliser votre ArcGIS GeoAnalytics Server en vue d'une analyse, reportez-vous à la rubrique GeoAnalytics Tools.
Une analyse semblable peut également être réalisée à l’aide de l’outil Similarity Search (Recherche de similarités) de la boîte d’outils Statistiques spatiales dans ArcGIS AllSource.

Paramètres

Étiquette	Explication	Type de données
Couche en entrée	Couche de référence (ou une sélection sur une couche) contenant les entités à apparier. L’outil recherche d’autres entités similaires à ces entités. Lorsque plusieurs entités sont fournies, l'appariement repose sur la moyenne des attributs.	Table View
Couche de recherche	Couche candidate (ou une sélection sur une couche) contenant les entités correspondant aux entités candidates. L’outil recherche les entités les plus similaires (ou dissemblables) au paramètre Input Layer (Couche en entrée) parmi ces candidats.	Table View
Jeu de données en sortie	Nom de la classe d’entités en sortie. La classe d’entités en sortie contient un enregistrement pour chacun des paramètres Input Layer (Couche en entrée) et pour toutes les solutions trouvées.	Feature Class; Table
Champs d’analyse	Une liste d'attributs numériques représentant les critères d'appariement.	String
Les plus ou les moins similaires	Indique si les entités à rechercher sont les plus similaires ou les moins similaires au paramètre Input Layer (Couche en entrée). Le plus similaire—Recherche les entités les plus similaires. Le moins similaire—Recherche les entités les moins similaires. Les deux—Recherche à la fois les entités qui sont les plus similaires et les entités qui sont les moins similaires.	String
Méthode d’appariement	Indique si les appariements doivent reposer sur des valeurs ou des relations cosinusoïdales. Valeurs attributaires—La similarité et la dissemblance reposent sur la somme des différences des valeurs attributaires standardisées au carré de tous les attributs Analysis Fields (Champs d’analyse). Profils attributaires—La similarité et la dissemblance sont calculées comme une fonction de la similarité cosinusoïdale de tous les attributs Analysis Fields (Champs d’analyse).	String
Nombre de résultats	Nombre de solutions à trouver. Pour classer toutes les entités candidates, et 10 000 au maximum, entrez zéro ou un nombre supérieur au nombre total d’entités de type Search Layer (Couche de recherche).	Long
Ajouter des champs (Facultatif)	Une liste facultative d’attributs à inclure avec la sortie. Vous pouvez inclure un identifiant de nom, un champ de catégorie ou un champ de date, par exemple. Ces champs ne sont pas utilisés pour déterminer la similarité. Ils sont inclus uniquement dans les attributs du paramètre en sortie à titre de référence. Par défaut, tous les champs sont ajoutés.	Field

arcpy.geoanalytics.FindSimilarLocations(input_layer, search_layer, output, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields})

Nom	Explication	Type de données
input_layer	Couche de référence (ou une sélection sur une couche) contenant les entités à apparier. L’outil recherche d’autres entités similaires à ces entités. Lorsque plusieurs entités sont fournies, l'appariement repose sur la moyenne des attributs.	Table View
search_layer	Couche candidate (ou une sélection sur une couche) contenant les entités correspondant aux entités candidates. L’outil recherche les entités les plus similaires (ou dissemblables) au paramètre input_layer parmi ces candidats.	Table View
output	Le jeu de données en sortie contient un enregistrement pour chacune des valeurs du paramètre input_layer et pour toutes les solutions trouvées.	Feature Class; Table
analysis_fields [analysis_fields,...]	Une liste d'attributs numériques représentant les critères d'appariement.	String
most_or_least_similar	Indique si les entités à rechercher sont les plus similaires ou les moins similaires au paramètre input_layer. MOST_SIMILAR—Recherche les entités les plus similaires. LEAST_SIMILAR—Recherche les entités les moins similaires. BOTH—Recherche à la fois les entités qui sont les plus similaires et les entités qui sont les moins similaires.	String
match_method	Indique si les appariements doivent reposer sur des valeurs ou des relations cosinusoïdales. ATTRIBUTE_VALUES—La similarité et la dissemblance reposent sur la somme des différences des valeurs attributaires standardisées au carré de tous les attributs analysis_fields. ATTRIBUTE_PROFILES—La similarité et la dissemblance sont calculées comme une fonction de similarité cosinusoïdale de tous les attributs analysis_fields.	String
number_of_results	Nombre de solutions à trouver. Pour classer toutes les entités candidates, et 10 000 au maximum, entrez zéro ou un nombre supérieur au nombre total d’entités de type search_layer.	Long
append_fields [append_fields,...] (Facultatif)	Une liste facultative d’attributs à inclure avec la sortie. Vous pouvez inclure un identifiant de nom, un champ de catégorie ou un champ de date, par exemple. Ces champs ne sont pas utilisés pour déterminer la similarité. Ils sont inclus uniquement dans les attributs du paramètre en sortie à titre de référence. Par défaut, tous les champs sont ajoutés.	Field

Exemple de code

Exemple d’utilisation de la fonction FindSimilarLocations (fenêtre Python)

Le script suivant pour la fenêtre Python illustre l’utilisation de la fonction FindSimilarLocations.

#-------------------------------------------------------------------------------
# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store

# Import system modules
import arcpy

arcpy.env.workspace = "C:/data/SalesData.gdb"

# Set local variables
referenceStore = "TopPerformer"
candidateStores = "AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"

# Run Find Similar Locations
arcpy.gapro.FindSimilarLocations(referenceStore, candidateStores, 
                                 outputName, analysisFields, 
                                 "MOST_SIMILAR", "ATTRIBUTE_VALUES", 10)

Environnements

Système de coordonnées en sortie, Étendue, Espace de travail courant

Vous avez un commentaire à formuler concernant cette rubrique ?