Rechercher des agrégats avec l’algorithme des K-moyennes

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

Cette fonction utilise l’algorithme K-moyennes pour identifier des agrégats naturels d’entités en fonction de l’emplacement ou des valeurs attributaires. Elle recherche une solution dans laquelle toutes les entités de chaque agrégat sont aussi similaires que possible, et où tous les agrégats sont aussi différents que possible.

Exemples

Une organisation non gouvernementale collecte des données sur du matériel de pêche abandonné et sur d’autres gros débris retrouvés au large. L’emplacement des débris peut être analysé de façon à repérer des agrégats de débris. Cela aidera l’organisation à déterminer les sources principales du matériel abandonné et des débris.

Il est possible également d’analyser la clientèle d’un magasin de vente au détail en fonction de critères démographiques et d’habitudes d’achat. Les agrégats basés sur des propriétés telles que le revenu disponible et les dépenses de consommation pourraient alors être utilisés pour élaborer la meilleure stratégie marketing pour le magasin.

Utiliser la fonction Find K-Means Clusters (Rechercher des agrégats K-moyennes)

La fonction Rechercher des agrégats K-moyennes peut être exécutée sur une fiche de carte, de diagramme ou de table à l’aide d’entités ponctuelles, linéaires ou surfaciques.

Procédez comme suit pour exécuter la fonction Find K-Means Clusters (Rechercher des agrégats K-moyennes) :

  1. Le cas échéant, cliquez sur la fiche de carte pour l’activer. Une fiche est active lorsque la barre d'outils et le bouton Action Opération apparaissent.
  2. Cliquez sur le bouton Action et effectuez l’une des opérations suivantes :
    • Pour une fiche de carte, dans l’onglet Spatial analysis (Analyse spatiale), cliquez sur Find K-Means Clusters (Rechercher des agrégats K-moyennes).
    • Pour les fiches de diagramme et de table, cliquez sur How is it distributed? (Quel est le type de distribution ?), puis cliquez sur Find K-Means Clusters (Rechercher des agrégats K-moyennes).
  3. Sous Choose a layer (Choisir une couche), sélectionnez la couche pour laquelle vous souhaitez rechercher des agrégats.
  4. Sous Analysis Fields (Champs d’analyse), choisissez l’une des options suivantes :
    • Pour exécuter la fonction Rechercher des agrégats K-moyennes dans le cadre d’une analyse spatiale, sélectionnez un champ d’emplacement.
    • Pour exécuter la fonction Rechercher des agrégats K-moyennes dans le cadre d’une analyse non spatiale, sélectionnez un ou plusieurs champs numériques.
  5. Développez la section Additional options (Autres options) et entrez une valeur pour le paramètre Number of clusters (Nombre d’agrégats), si nécessaire.
  6. Cliquez sur Run (Exécuter).

Remarques sur l’utilisation

Le paramètre Choose a layer (Choisir une couche) permet de sélectionner le jeu de données où rechercher des agrégats. Le jeu de données peut contenir des entités ponctuelles, linéaires ou surfaciques. Il peut aussi s’agir d’une table non spatiale (à condition d’utiliser la fonction à partir d’un diagramme ou d’une table).

Le paramètre Analysis Fields (Champs d’analyse) permet de choisir le champ sur lequel les agrégats seront basés. Il peut s’agir soit d’un champ d’emplacement (les agrégats seront alors basés sur l’emplacement géographique), soit d’un ou plusieurs champs numériques ou de taux/ratio (les agrégats seront alors basés sur la similarité entre les attributs). Il n’est pas possible de combiner un champ d’emplacement avec des champs numériques ou de taux/ratio.

Vous pouvez développer la section Additional options (Autres options) pour révéler le paramètre Number of clusters (Nombre d’agrégats). Si vous avez besoin d’un nombre spécifique d’agrégats pour votre analyse, entrez cette valeur dans le paramètre Number of clusters (Nombre d’agrégats). Si aucune valeur n’est saisie, les agrégats permettant d’optimiser les similarités au sein d’un agrégat et les différences entre les agrégats, seront calculés en fonction de l’index Davies-Bouldin décrit dans Davies and Bouldin (1979).

Limitations

Cet outil n’est pas pris en charge pour les connexions en lecture seule à Google BigQuery, Snowflake et aux plateformes de base de données qui ne sont pas prises en charge immédiatement.

Il est possible d’appliquer des filtres croisés, des widgets de filtre et des widgets de filtre temporel aux résultats de la fonction Find K-Means Clusters (Rechercher des agrégats K-moyennes), mais l’outil n’est pas réexécuté à chaque fois que le filtre est modifié.

Bibliographie

Davies, David L. et Donald W. Bouldin. 1979. « A Cluster Separation Measure. » IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-1, n° 2 (avril) : 224 - 227.https://doi.org/10.1109/TPAMI.1979.4766909.