Disponible dans les analyses de Big Data.
L'outil Find Similar Locations (Rechercher des emplacements similaires) identifie les entités candidates qui sont les plus similaires ou qui diffèrent le plus d’une ou de plusieurs entités de référence selon les attributs d’entité.
Diagramme de workflow
Exemples
Vous trouverez ci-dessous des exemples d’utilisation de l’outil Rechercher des localisations similaires :
- Parmi vos installations de production, déterminez celles qui sont les plus similaires à votre installation la plus productive selon la relation entre les valeurs attributaires numériques.
- Un analyste de la criminalité souhaite effectuer une recherche dans une base de données de tous les crimes pour déterminer si un crime récent s’inscrit éventuellement dans un modèle ou une tendance plus large.
- Déterminez les autres villages susceptibles d’être touchés par une maladie selon les caractéristiques des villages qui ont été les plus touchés.
Remarques sur l’utilisation
Gardez les points suivants à l’esprit lorsque vous utilisez l’outil Rechercher des localisations similaires :
- Des entités tabulaires, ponctuelles, polylignes ou surfaciques peuvent être utilisées.
- Il est nécessaire de disposer d’entités de recherche (candidates), qui seront classées par similarité ou par dissemblance par rapport aux emplacements de référence.
- Un maximum de 10 000 entités de la couche de recherche peuvent être renvoyées.
- S’il existe plusieurs entités dans la valeur du paramètre Target layer (reference location features) [Couche cible (entités d'emplacement de référence)], la correspondance se fait par rapport aux valeurs moyennes des entités de référence. Par exemple, s’il existe deux entités de référence et qu’un des attributs des champs d’analyse contient une variable liée à la population, l’outil va rechercher la valeur du paramètre Join layer (candidate search features) [Couche de jointure (entités de recherche candidates)] dont le relevé de population est semblable aux valeurs moyennes de population. Si les valeurs de population sont de 100 et 102, par exemple, l’outil recherche des candidats dont la population avoisine 101.
Remarque :
S’il existe plusieurs entités dans le paramètre Target layer (reference location features) [Couche cible (entités d'emplacement de référence)] sélectionnez Base similarity on (analysis fields) [Baser la similarité sur (les champs d’analyse)] pour rechercher des attributs ayant des valeurs similaires. Si, par exemple, la valeur de population d’une des entités est de 100 et que l’autre est de 100 000, l’outil recherche des correspondances dont la population avoisine la moyenne de ces deux valeurs : 50 050. Cette valeur moyenne n’est proche de la valeur de population d’aucune des deux couches.
- Utilisez le paramètre Similarity (Similarité) pour rechercher les entités qui sont les plus similaires ou qui diffèrent le plus des entités de référence, respectivement à l’aide de l’option Most similar (Plus similaire) ou Least similar (Moins similaire). Dans certains cas, vous pouvez avoir besoin de consulter les deux paramètres. Si la valeur du paramètre Similarity (Similarité) est 3 et que la valeur du paramètre Similarity (Similarité) est définie sur Most and least similar (Le plus et le moins similaire) par exemple, l’outil recherche les trois entités candidates les plus similaires et les trois entités candidates les moins similaires.
- Toute solution donnée en sortie est soit la plus similaire, soit la moins similaire aux entités de référence. Une seule solution ne peut pas être les deux à la fois (et les solutions ne sont pas dupliquées dans les entités en sortie). En conséquence, lorsque la valeur du paramètre Similarity (Similarité) est Most and least similar (Le plus et le moins similaire), le nombre maximal de résultats possibles (nombre de résultats) correspond à la moitié du nombre de la valeur Join layer (Couche de jointure).
- Les deux options du paramètre Match Method (Méthode d’appariement) sont :
- Attribute values (Valeurs attributaires) : les candidats les plus similaires auront la plus petite somme des différences au carré pour tous les attributs de champs d’analyse. Toutes les valeurs sont normalisées avant le calcul des différences.
- Attribute profiles (Profils attributaires) : la similarité cosinusoïdale est mesurée. La similarité cosinusoïdale recherche les relations identiques parmi les valeurs attributaires normalisées au lieu de se préoccuper de l’appariement des amplitudes des attributs. Par exemple, prenons trois champs d’analyse appelés A1, A2 et A3. A2 est deux fois plus grand qu’A1 et A3 est presque identique à A2. Si le paramètre Match method (Méthode d’appariement) est défini sur Attribute profiles (Profils attributaires), l’outil recherche les candidats présentant ces mêmes relations attributaires : A2 est deux fois plus grand que A1 et A3 est presque identique à A2. Comme cette méthode recherche des relations entre les attributs, vous devez spécifier un minimum de deux attributs de champs d’analyse. Vous pouvez utiliser la méthode de similarité cosinusoïdale (option Attribute profiles [Profils attributaires]) pour rechercher des lieux similaires à Los Angeles, mais à une autre échelle, par exemple, le profil de la population par rapport au nombre de voitures et au nombre de résidents de moins de 20 ans. L'index de similarité cosinusoïdale s'étend de 1,0 (similarité parfaite) à -1,0 (dissemblance parfaite). L’index de similarité cosinusoïdale est indiqué dans le champ simindex de l’entité en sortie.
- Le paramètre Base similarity on (Baser la similarité sur) doit être une valeur numérique et renseigné. Le nom et le type de champ doivent être identiques dans les entités d'emplacement de référence (couche cible) et les jeux de données (couche de jointure) de recherche de candidats. Si l’outil ne trouve aucun champ correspondant pour les entités (couche de jointure) de recherche de candidats, un avertissement de validation apparaît, indiquant que les noms de champ doivent être identiques.
- Tous les attributs utilisés pour l'appariement sont inscrits dans la sortie. Utilisez le paramètre Append fields (Ajouter des champs) pour spécifier les champs à ajouter à la table en sortie. Par défaut, tous les champs sont ajoutés. Utilisez le paramètre Append fields (Ajouter des champs) pour sélectionner des champs spécifiques dans la couche de jointure que vous souhaitez ajouter.
Paramètres
Les paramètres de l’outil Rechercher des localisations similaires sont les suivants :
Paramètre | Description | Type de données |
---|---|---|
Couche cible (entités de localisation de référence) | Couche cible contenant les entités de référence. Les entités de référence peuvent être réduites ou filtrées à l’aide des paramètres Reference locations expression (Expression des emplacements de référence) ou Reference Locations Extent (Étendue des emplacements de référence) (ci-dessous). | Entités |
Couche de jointure (entités de recherche candidates) | Couche de jointure contenant les entités candidates ou de recherche. L’outil évalue les entités de recherche pour trouver celles dont les valeurs attributaires du champ d’analyse sont similaires à celles du paramètre Target layer (reference features) [Couche cible (entités de référence)]. | Entités |
Reference locations expression (Expression des emplacements de référence) | Expression attributaire Arcade qui est évaluée pour filtrer la couche cible (entités de référence) à conserver. La configuration de l’expression se fait dans le générateur d’expressions Arcade, auquel vous pouvez accéder en cliquant sur Configure an Arcade Expression (Configurer une expression Arcade). Chaque enregistrement est évalué, et les enregistrements évalués comme vrais sont conservés, tandis que les enregistrements évalués comme faux sont ignorés. | Chaîne (expression Arcade) |
Étendue des emplacements de référence | Vous pouvez également fournir une étendue pour filtrer les localisations de référence. Seules les entités de référence situées dans l’étendue spatiale de référence spécifiée pour ce paramètre seront conservées comme entités de référence. Dans la configuration de l’outil, un composant de sélection de l’étendue permet de dessiner une étendue de localisation de référence. | Enveloppe EsriJSON |
Baser la similarité sur | Spécifie un ou plusieurs attributs numériques (champs d’analyse) intéressants. Les valeurs présentes pour ces champs attributaires sont calculées pour la valeur du paramètre Target layer (reference location features) [Couche cible (entités d'emplacement de référence)]. Les entités du paramètre Join layer (candidate search features) [Couche de jointure (entités de recherche de candidats)] sont ensuite évaluées pour déterminer quelles entités de recherche sont les plus similaires ou les moins similaires aux entités de référence. | Chaîne (noms de champ) |
Similarité | Détermine si les résultats renvoyés par cet outil seront les plus similaires ou les moins similaires à la valeur du paramètre Target layer (reference location features) [Couche cible (entités d'emplacement de référence)] fournie pour les champs d’analyse spécifiés. Le nombre maximal de résultats pouvant être renvoyés est de 10 000. Vous pouvez choisir l'option Similar (Similaire), Least similar (Le moins similaire), ou Most and least similar (Le plus et le moins similaire) pour renvoyer les entités. | Entier et chaîne |
Match method (Méthode d’appariement) | Deux méthodes d’appariement sont disponibles :
| Chaîne |
Append fields (Ajouter des champs) | Tous les attributs utilisés pour l'appariement sont inscrits dans la sortie. Le paramètre Append fields (Ajouter des champs) vous permet d’indiquer uniquement les champs spécifiques à ajouter à la table en sortie. Par défaut, tous les champs sont ajoutés. Utilisez le paramètre Append fields (Ajouter des champs) pour sélectionner des champs spécifiques à partir de la valeur du paramètre Join layer (candidate search features) [Couche de jointure (entités de recherche de candidats)] que vous souhaitez ajouter. | Chaîne (noms de champ) |
Reference ID field (Champ d’ID de référence) (facultatif) | Champ qui contient des ID uniques dans la structure Target layer (reference location features) [Couche cible (entités d'emplacement de référence)]. Si aucun champ n’est sélectionné, l’outil génère des ID uniques pour les entités. | Chaîne (nom de champ) |
Candidate ID field (Champ d’ID candidat) (facultatif) | Champ qui contient des ID uniques dans la structure Join layer (candidate search features) [Couche de jointure (entités de recherche de candidats)]. Si aucun champ n’est sélectionné, l’outil génère des ID uniques pour les entités. | Chaîne (nom de champ) |
Couche en sortie
Toutes les entités du paramètre Target layer (reference location features) [Couche cible (entités d'emplacement de référence)] et les correspondances du paramètre Join layer (candidate search features) [Couche de jointure (entités de recherche de candidats)] sont écrites sur les entités en sortie avec les attributs issus des paramètres Base similarity on (Baser la similarité sur) et Append fields (Ajouter des champs). De plus, les champs suivants sont inclus dans les entités en sortie :
Nom du champ | Description | Remarques |
---|---|---|
location_type | Chaîne indiquant si les entités constituent une couche de référence cible ou des entités de recherche (candidates) de jointure. | |
simrank | Si vous sélectionnez Most similar (Les plus similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité), toutes les solutions sont classées de la plus similaire à la moins similaire. La valeur de classement de la solution la plus similaire est de 1. | Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Least similar (Les moins similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité). |
dissimrank | Si vous sélectionnez Least similar (Les moins similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité), toutes les solutions sont classées de la moins similaire à la plus similaire. La valeur de classement de la solution la moins similaire est de 1. | Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Least similar (Les moins similaires) ou Most and least similar (Les plus et les moins similaires) pour le paramètre Similarity (Similarité). |
simindex | Ce champ quantifie la similarité de chaque solution par rapport aux entités de référence cibles. Lorsque vous renseignez le champ Attribute values (Valeurs attributaires) comme valeur du paramètre Match method (Méthode d’appariement), cette valeur représente la somme des différences des valeurs au carré. | Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Attribute values (Valeurs attributaires) pour le paramètre Match method (Méthode d'appariement). |
cosimindex | Ce champ quantifie la similarité de chaque solution par rapport aux entités cibles. Lorsque vous spécifiez Attribute profiles (Profils attributaires) pour le paramètre Match method (Méthode d’appariement), cette valeur représente la similarité cosinusoïdale. | Ce champ est inclus uniquement dans les entités en sortie lorsque vous sélectionnez Attribute profiles (Profils attributaires) pour le paramètre Match method (Méthode d'appariement). |
labelrank | Ce champ est fourni uniquement à des fins d’affichage. L'outil utilise ce champ pour fournir le rendu par défaut des résultats d'analyse. | |
reference_id | Valeur d’ID unique pour les entités de référence cibles. Les entités de recherche (candidates) de jointure reçoivent une valeur nulle. Si le paramètre Reference ID field (Champ d’ID de référence) n’est pas spécifié, une valeur d’ID unique est générée pour les entités de référence. | |
search_id | Valeur d’ID unique pour les entités de recherche (candidates) de jointure. Les entités de référence cibles reçoivent une valeur nulle. Si le paramètre Candidate ID field (Champ d’ID de candidat) n’est pas spécifié, une valeur d’ID unique est générée pour les entités candidates ou de recherche. |
Vous avez un commentaire à formuler concernant cette rubrique ?