Trovare cluster K-Means trova cluster naturali di feature in base alla posizione o ai valori di attributo usando l'algoritmo K-Means. L'algoritmo classifica le feature in modo che le feature all'interno di un cluster siano più simili possibile e i cluster siano più diversi possibile.
Esempi
Seguono alcuni scenari di esempio in cui si utilizza Trova cluster K-Means:
- Un'organizzazione non governativa raccoglie dati su attrezzatura di pesca abbandonati e altri grandi residui in mare aperto. La posizione dei residui può essere analizzata per trovare gruppi di residui, al fine di consentire all'organizzazione di determinare le principali fonti delle attrezzature abbandonate e dei residui.
- I clienti di un punto vendita possono essere analizzati in base alle loro caratteristiche demografiche e ai loro modelli d'acquisto. I cluster basati su proprietà come reddito disponibile e spese possono essere utilizzati per progettare una strategia di marketing per il negozio.
Eseguire Trova cluster K-Means:
Trovare cluster K-Means può essere eseguito su schede di mappa, grafico o tabella usando feature puntuali, feature lineari o feature areali.
Attenersi alla seguente procedura per trovare cluster naturali:
- Se necessario, fare clic sulla scheda di mappa per attivarla.
Una scheda è attiva quando appaiono la barra degli strumenti e il pulsante Azione.
- Fare clic sul pulsante Azione ed effettuare una delle operazioni di seguito:
- Per una scheda di mappa, sulla scheda Analisi spaziale, fare clic su Trovare cluster K-Means.
- Per schede di mappa e tabella, fare clic su Come è distribuito? e fare clic su Trovare cluster K-Means.
- Per Scegli un layer, selezionare il layer desiderato per trovare i cluster.
- Per Campi di analisi, selezionare una delle seguenti opzioni:
- Per eseguire Trovare cluster K-Means in modo spaziale, selezionare un campo delle posizioni.
- Per eseguire Trovare cluster K-Means in modo non spaziale, selezionare uno o più campi numerici.
- Espandere Opzioni aggiuntive e immettere un valore per il parametro Numero di cluster, se necessario.
- Fare clic su Esegui.
Note sull'utilizzo
Il parametro Scegli un layer viene utilizzato per selezionare un dataset per trovare i cluster. Il dataset può avere feature puntuali, lineari o areali oppure può essere una tabella non spaziale (disponibile quando si utilizza la funzionalità da un grafico o da una tabella).
Il parametro Campi di analisi viene utilizzato per selezionare il campo su cui saranno basati i cluster. Il campo può essere un campo delle posizioni , nel qual caso i cluster saranno basati sulla posizione geografica o uno o più campi numerici o di frequenza/rapporto, nel qual caso i cluster saranno basati sulla somiglianza tra attributi. Una combinazione di campi delle posizioni e del numero o frequenza/rapporto non è supportata.
È possibile espandere Opzioni aggiuntive per visualizzare il parametro di Numero di cluster. Se per l'analisi è richiesto un numero specifico di cluster, immettere quel valore nel parametro Numero di cluster. Se non viene fornito alcun valore, viene calcolato un certo numero di cluster utilizzando l'indice Davies-Bouldin descritto in Davies and Bouldin (1979), che ottimizza le somiglianze all'interno di un cluster e le differenze tra i cluster.
Limitazioni
Questo strumento non è supportato per le connessioni di sola lettura aGoogle BigQuery, e piattaforme di database non supportate per essere pronte all'uso.
I filtri incrociati, i widget filtro e i widget filtro temporali possono essere applicati ai risultati di Trova cluster K-Means, ma non rieseguono lo strumento ogni volta che il filtro viene cambiato.
Riferimenti
Davies, David L. e Donald W. Bouldin. 1979. "A Cluster Separation Measure." IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-1, no. 2 (April): 224 - 227.https://doi.org/10.1109/TPAMI.1979.4766909.