Cette fonction utilise l’algorithme K-moyennes pour identifier des agrégats naturels d’entités en fonction de l’emplacement ou des valeurs attributaires. L’algorithme classe les entités de sorte que les entités de chaque agrégat soient aussi similaires que possible et que tous les agrégats soient aussi différents que possible.
Exemples
Voici des exemples de scénario utilisant la fonction Find K-Means Clusters (Rechercher des agrégats K-moyennes).
- Une organisation non gouvernementale collecte des données sur du matériel de pêche abandonné et sur d’autres gros débris retrouvés au large. L’emplacement des débris peut être analysé de façon à repérer des agrégats de débris. Cela aidera l’organisation à déterminer les sources principales du matériel abandonné et des débris.
- Il est possible également d’analyser la clientèle d’un magasin de vente au détail en fonction de critères démographiques et d’habitudes d’achat. Les agrégats basés sur des propriétés telles que le revenu disponible et les dépenses de consommation pourraient alors être utilisés pour élaborer la meilleure stratégie marketing pour le magasin.
Exécuter la fonction Find K-Means Clusters (Rechercher des agrégats K-moyennes)
La fonction Rechercher des agrégats K-moyennes peut être exécutée sur une fiche de carte, de diagramme ou de table à l’aide d’entités ponctuelles, linéaires ou surfaciques.
Procédez comme suit pour rechercher des agrégats naturels :
- Le cas échéant, cliquez sur la fiche de carte pour l’activer.
Une fiche est active lorsque la barre d'outils et le bouton Action apparaissent.
- Cliquez sur le bouton Action et effectuez l’une des opérations suivantes :
- Pour une fiche de carte, dans l’onglet Spatial analysis (Analyse spatiale), cliquez sur Find K-Means Clusters (Rechercher des agrégats K-moyennes).
- Pour les fiches de diagramme et de table, cliquez sur How is it distributed? (Quel est le type de distribution ?), puis cliquez sur Find K-Means Clusters (Rechercher des agrégats K-moyennes).
- Sous Choose a layer (Choisir une couche), sélectionnez la couche pour laquelle vous souhaitez rechercher des agrégats.
- Sous Analysis Fields (Champs d’analyse), choisissez l’une des options suivantes :
- Pour exécuter la fonction Rechercher des agrégats K-moyennes dans le cadre d’une analyse spatiale, sélectionnez un champ d’emplacement.
- Pour exécuter la fonction Rechercher des agrégats K-moyennes dans le cadre d’une analyse non spatiale, sélectionnez un ou plusieurs champs numériques.
- Développez la section Additional options (Options supplémentaires) et entrez une valeur pour le paramètre Number of clusters (Nombre d’agrégats), si nécessaire.
- Cliquez sur Run (Exécuter).
Remarques sur l’utilisation
Le paramètre Choose a layer (Choisir une couche) permet de sélectionner le jeu de données où rechercher des agrégats. Le jeu de données peut contenir des entités ponctuelles, linéaires ou surfaciques. Il peut aussi s’agir d’une table non spatiale (à condition d’utiliser la fonction à partir d’un diagramme ou d’une table).
Le paramètre Analysis Fields (Champs d’analyse) permet de choisir le champ sur lequel les agrégats seront basés. Il peut s’agir soit d’un champ d’emplacement (les agrégats seront alors basés sur l’emplacement géographique), soit d’un ou plusieurs champs numériques ou de taux/ratio (les agrégats seront alors basés sur la similarité entre les attributs). Il n’est pas possible de combiner un champ d’emplacement avec des champs numériques ou de taux/ratio.
Vous pouvez développer la section Additional options (Autres options) pour révéler le paramètre Number of clusters (Nombre d’agrégats). Si un nombre spécifique d’agrégats est requis pour l’analyse, entrez cette valeur pour le paramètre Number of clusters (Nombre d’agrégats). Si aucune valeur n’est entrée, le nombre d’agrégats permettant d’optimiser les similarités au sein d’un agrégat et les différences entre les agrégats est calculé à l’aide de l’index Davies-Bouldin décrit dans Davies and Bouldin (1979).
Limitations
Cet outil n’est pas pris en charge pour les connexions en lecture seule à Google BigQuery, Snowflake et aux plateformes de base de données qui ne sont pas prises en charge immédiatement.
Il est possible d’appliquer des filtres croisés, des widgets de filtre et des widgets de filtre temporel aux résultats de la fonction Find K-Means Clusters (Rechercher des agrégats K-moyennes), mais l’outil n’est pas réexécuté à chaque fois que le filtre est modifié.
Bibliographie
Davies, David L. et Donald W. Bouldin. 1979. « A Cluster Separation Measure. » IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-1, n° 2 (avril) : 224 - 227.https://doi.org/10.1109/TPAMI.1979.4766909.
Vous avez un commentaire à formuler concernant cette rubrique ?