Rechercher des emplacements similaires

Icône d’outil Disponible dans les analyses de Big Data.

L’outil Rechercher des emplacements similaires Outil Rechercher des emplacements similaires identifie les entités candidates les plus similaires ou les moins similaires à une ou plusieurs entités de référence en fonction d’attributs d’entités.

Diagramme de workflow

Diagramme de workflow Identifier des emplacements similaires

Exemples

Vous trouverez ci-dessous des exemples d’utilisation de l’outil Rechercher des localisations similaires :

  • Parmi vos installations de production, déterminez celles qui sont les plus similaires à votre installation la plus productive en fonction de la relation entre les valeurs attributaires numériques.
  • Procédez à une analyste de la criminalité en effectuant une recherche dans une base de données de tous les crimes pour déterminer si un crime récent s’inscrit éventuellement dans un modèle ou une tendance plus large.
  • Déterminez les autres villages susceptibles d’être touchés par une maladie selon les caractéristiques des villages qui ont été les plus touchés.

Remarques sur l’utilisation

Lorsque vous utilisez l’outil Rechercher des localisations similaires, gardez à l’esprit les points suivants :

  • Vous pouvez utiliser des entités tabulaires, ponctuelles, polylignes ou surfaciques.
  • Il est nécessaire de disposer d’entités (candidates) de recherche, qui sont classées par similarité ou par dissemblance par rapport aux emplacements de référence.
  • Un maximum de 10 000 entités de la couche de recherche sont renvoyées.
  • S’il existe plusieurs entités dans la valeur du paramètre Target layer (reference location features) [Couche cible (entités d'emplacement de référence)], la correspondance se fait par rapport aux valeurs moyennes des entités de référence. Par exemple, s’il existe deux entités de référence et qu’un des attributs des champs d’analyse est une variable de population, l’outil recherche la valeur du paramètre Join layer (candidate search features) (Couche de jointure [entités de recherche candidates]) dont le relevé de population est similaire aux valeurs moyennes de population. Si les valeurs de population sont de 100 et 102, par exemple, l’outil recherche des candidats dont la population avoisine 101.
    Remarque :

    S’il existe plusieurs entités dans le paramètre Target layer (reference location features) [Couche cible (entités d'emplacement de référence)] sélectionnez Base similarity on (analysis fields) [Baser la similarité sur (les champs d’analyse)] pour rechercher des attributs ayant des valeurs similaires. Par exemple, si la valeur de population de l’une des entités est de 100 et que l’autre est de 100 000, l’outil recherche des correspondances avec des populations proches de la moyenne de ces deux valeurs : 50 050. Cette valeur moyenne n’est proche de la valeur de population d’aucune des deux couches.

  • Utilisez le paramètre Similarity (Similarité) pour rechercher les entités qui sont les plus similaires ou qui diffèrent le plus des entités de référence, respectivement à l’aide de l’option Most similar (Plus similaire) ou Least similar (Moins similaire). Dans certains cas, vous pouvez avoir besoin de consulter les deux paramètres. Si la valeur du paramètre Similarity (Similarité) est 3 et que la valeur du paramètre Similarity (Similarité) est définie sur Most and least similar (Le plus et le moins similaire), par exemple, l’outil recherche les trois entités candidates les plus similaires et les trois entités candidates les moins similaires.
  • Chaque correspondance d’une solution donnée en sortie est soit la plus similaire, soit la moins similaire aux entités de référence. Une même solution ne peut pas être les deux à la fois (et les correspondances de solution ne seront pas dupliquées dans des entités en sortie). Ainsi, lorsque la valeur du paramètre Similarity (Similarité) est Most and least similar (Le plus et le moins similaire), le nombre maximal de correspondances possible (nombre de résultats) représente la moitié du nombre de la couche de jointure.
  • Les deux options du paramètre Match Method (Méthode d’appariement) sont les suivantes :
    • Attribute values (Valeurs attributaires) : les candidats les plus similaires ont la plus petite somme de différences au carré pour tous les attributs de champs d’analyse. Toutes les valeurs sont normalisées avant le calcul des différences.
    • Attribute profiles (Profils attributaires) : la similarité cosinusoïdale est mesurée. La similarité cosinusoïdale recherche les relations identiques parmi les valeurs attributaires normalisées au lieu de se préoccuper de l’appariement des amplitudes des attributs. Par exemple, prenons trois champs d’analyse appelés A1, A2 et A3. A2 est deux fois plus grand qu’A1 et A3 est presque identique à A2. Si le paramètre Match method (Méthode d’appariement) est défini sur Attribute profiles (Profils attributaires), l’outil recherche les candidats présentant ces relations attributaires : A2 est deux fois plus grand que A1, et A3 est presque égal à A2. Comme cette méthode recherche des relations entre les attributs, vous devez spécifier un minimum de deux attributs de champs d’analyse. Vous pouvez utiliser la méthode de similarité cosinusoïdale (option Attribute profiles [Profils attributaires]) pour rechercher des lieux similaires à Los Angeles, mais à une autre échelle, par exemple, le profil de la population par rapport au nombre de voitures et au nombre de résidents de moins de 20 ans. L'index de similarité cosinusoïdale s'étend de 1,0 (similarité parfaite) à -1,0 (dissemblance parfaite). L’index de similarité cosinusoïdale est indiqué dans le champ simindex de l’entité en sortie.
  • Le paramètre Base similarity on (Baser la similarité sur) doit être une valeur numérique et renseigné. Le nom et le type de champ doivent être identiques dans les entités d'emplacement de référence (couche cible) et les jeux de données (couche de jointure) de recherche de candidats. Si l’outil ne trouve aucun champ correspondant pour les entités (couche de jointure) de recherche de candidats, un avertissement de validation apparaît, indiquant que les noms de champ doivent être identiques.
  • Tous les attributs utilisés pour l'appariement sont inscrits dans la sortie. Utilisez le paramètre Append fields (Ajouter des champs) pour préciser les champs à ajouter à la sortie. Par défaut, tous les champs sont ajoutés. Utilisez le paramètre Append fields (Ajouter des champs) pour sélectionner les champs précis de la couche de jointure que vous souhaitez ajouter.

Paramètres

Les paramètres de l’outil Rechercher des localisations similaires sont les suivants :

ParamètreDescriptionType de données

Couche cible (entités de localisation de référence)

Couche cible contenant les entités de référence. Les entités de référence peuvent être réduites ou filtrées à l’aide des paramètres Reference locations expression (Expression des emplacements de référence) ou Reference Locations Extent (Étendue des emplacements de référence) (ci-dessous).

Entités

Couche de jointure (entités de recherche candidates)

Couche de jointure contenant les entités candidates ou de recherche. L’outil évalue les entités de recherche pour trouver celles ayant des valeurs attributaires de champs d’analyse similaires par comparaison avec le paramètre Target layer (reference features) (Couche cible [entités de référence]).

Entités

Reference locations expression (Expression des emplacements de référence)

Expression attributaire Arcade qui est évaluée pour filtrer la couche cible (entités de référence) à conserver. La configuration de l’expression se fait dans le générateur d’expressions Arcade, auquel vous pouvez accéder en cliquant sur Configure an Arcade Expression (Configurer une expression Arcade).

Chaque enregistrement est évalué, et les enregistrements évalués comme vrais sont conservés, tandis que les enregistrements évalués comme faux sont ignorés.

Chaîne (expression Arcade)

Étendue des emplacements de référence

(Facultatif)

Lorsque ce paramètre est utilisé, seules les entités de référence situées dans l’étendue spatiale de référence spécifiée pour ce paramètre sont conservées comme entités de référence.

Dans la configuration de l’outil, un composant de sélection de l’étendue permet de dessiner une étendue de localisation de référence.

Enveloppe JSON Esri

Baser la similarité sur

(champs d’analyse)

Spécifie un ou plusieurs attributs numériques (champs d’analyse) intéressants. Les valeurs présentes pour ces champs attributaires sont calculées pour la valeur du paramètre Target layer (reference location features) (Couche cible [entités d’emplacement de référence]).

Les entités du paramètre Join layer (candidate search features) (Couche de jointure [entités de recherche de candidats]) sont ensuite évaluées pour déterminer quelles entités de recherche sont les plus similaires ou les moins similaires aux entités de référence.

Chaîne (noms de champ)

Similarité

Détermine si les résultats renvoyés par cet outil sont les plus similaires ou les moins similaires à la valeur du paramètre Target layer (reference location features) (Couche cible [entités d’emplacement de référence]) fournie pour les champs d’analyse spécifiés.

Le nombre maximal de résultats pouvant être renvoyés est de 10 000.

Vous pouvez sélectionner l’option des emplacements les plus similaires, les moins similaires ou les plus et les moins similaires pour le renvoi des entités.

Entier et chaîne

Match method (Méthode d’appariement)

Deux méthodes d’appariement sont disponibles :

  • Attribute values (Valeurs attributaires) : les candidats les plus similaires ont la plus petite somme de différences au carré pour tous les attributs de champs d’analyse. Toutes les valeurs sont normalisées avant le calcul des différences.
  • Attribute profiles (Profils attributaires) : la similarité cosinusoïdale est mesurée. La similarité cosinusoïdale recherche les relations identiques parmi les valeurs attributaires normalisées au lieu de se préoccuper de l’appariement des amplitudes des attributs. Par exemple, prenons trois champs d’analyse appelés A1, A2 et A3. Si la valeur du paramètre Match method (Méthode d’appariement) est Attribute profiles (Profils attributaires), l’outil recherche les candidats présentant ces mêmes relations attributaires : A2 est deux fois plus grand que A1, et A3 est presque égal à A2. Comme cette méthode recherche des relations entre les attributs, vous devez spécifier un minimum de deux attributs Attribute values (Valeurs attributaires). Vous pouvez utiliser la méthode de similarité cosinusoïdale (option Attribute profiles [Profils attributaires]) pour rechercher des lieux similaires à Los Angeles, mais à une autre échelle, par exemple le profil de la population par rapport au nombre de voitures et au nombre de résidents de moins de 20 ans. L'index de similarité cosinusoïdale s'étend de 1,0 (similarité parfaite) à -1,0 (dissemblance parfaite). L’index de similarité cosinusoïdale est indiqué dans le champ simindex de l’entité en sortie.

Chaîne

Append fields (Ajouter des champs)

Indique les champs à ajouter à la sortie. Par défaut, tous les champs sont ajoutés.

Le paramètre Append fields (Ajouter des champs) permet de sélectionner des champs spécifiques à partir de la valeur du paramètre Join layer (candidate search features) (Couche de jointure [entités de recherche de candidats]) que vous souhaitez ajouter.

Chaîne (noms de champ)

Champ d’ID de référence

(Facultatif)

Champ qui contient des ID uniques dans la structure Target layer (reference location features) [Couche cible (entités d'emplacement de référence)].

Si aucun champ n’est sélectionné, l’outil génère des ID uniques pour les entités.

Chaîne (nom de champ)

Champ d’ID candidat

(Facultatif)

Champ qui contient des ID uniques dans la structure Join layer (candidate search features) [Couche de jointure (entités de recherche de candidats)].

Si aucun champ n’est sélectionné, l’outil génère des ID uniques pour les entités.

Chaîne (nom de champ)

Couche en sortie

Toutes les entités de la couche cible et les correspondances dans la couche de jointure sont écrites dans les entités en sortie avec les attributs des paramètres Base similarity on (Baser la similarité sur) et Append fields (Ajouter des champs). De plus, les champs suivants sont inclus dans les entités en sortie :

Nom du champDescription

location_type

Chaîne indiquant si les entités constituent une couche de référence cible ou des entités de recherche (candidates) de jointure.

simrank

Si vous sélectionnez Most similar (Les plus similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité), toutes les correspondances de solution sont classées de la plus similaire à la moins similaire. La valeur de classement de la solution la plus similaire est de 1.

Remarque :

Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Least similar (Les moins similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité).

dissimrank

Si vous sélectionnez Least similar (Les moins similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité), toutes les correspondances de solution sont classées de la moins similaire à la plus similaire. La valeur de classement de la solution la moins similaire est de 1.

Remarque :

Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Least similar (Les moins similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité).

simindex

Ce champ quantifie la similarité de chaque solution par rapport aux entités de référence cibles. Lorsque vous renseignez le champ Attribute values (Valeurs attributaires) comme valeur du paramètre Match method (Méthode d’appariement), cette valeur représente la somme des différences des valeurs au carré.

Remarque :

Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Attribute values (Valeurs attributaires) pour le paramètre Match method (Méthode d'appariement).

cosimindex

Ce champ quantifie la similarité de chaque solution par rapport aux entités cibles. Lorsque vous spécifiez Attribute profiles (Profils attributaires) pour le paramètre Match method (Méthode d’appariement), cette valeur représente la similarité cosinusoïdale.

Remarque :

Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Attribute profiles (Profils attributaires) pour le paramètre Match method (Méthode d'appariement).

labelrank

Ce champ est fourni uniquement à des fins d’affichage. L'outil utilise ce champ pour fournir le rendu par défaut des résultats d'analyse.

reference_id

Valeur d’ID unique pour les entités de référence cibles. Les entités de recherche (candidates) de jointure reçoivent une valeur nulle.

Si le paramètre Reference ID field (Champ d’ID de référence) n’est pas spécifié, une valeur d’ID unique est générée pour les entités de référence.

search_id

Valeur d’ID unique pour les entités de recherche (candidates) de jointure. Les entités de référence cibles reçoivent une valeur nulle.

Si le paramètre Candidate ID field (Champ d’ID de candidat) n’est pas spécifié, une valeur d’ID unique est générée pour les entités candidates ou de recherche.