Trova cluster punti

Lo strumento Trova cluster punti identifica i cluster di feature punto dal disturbo circostante, in base alla relativa distribuzione spaziale.

Esempi

Di seguito vengono forniti alcuni esempi di utilizzo di questo strumento:

  • Un'organizzazione che studia una particolare malattia trasmessa da parassiti vuole identificare dove, nella propria area di studio, iniziare il trattamento e lo sterminio di questi parassiti. L'analista dispone di un dataset punto che rappresenta le famiglie infestate e non infestate nell'area di studio. L'analista utilizza lo strumento Trova cluster punto per trovare il cluster più grande di famiglie infestate.
  • Un'organizzazione di risposta alle catastrofi deve stabilire dove dispiegare le proprie risorse per il salvataggio e l'evacuazione in seguito a un disastro naturale. Un analista utilizza lo strumento Trova cluster punto per identificare i cluster di tweet geolocalizzati che menzionano l'evento. L'organizzazione utilizza le dimensioni e la posizione dei cluster per mappare l'area colpita e informare i propri interventi di rilievo.

Note sull'utilizzo

Lo strumento Trova cluster punto include le configurazioni per le feature di input, le impostazioni dei cluster e il layer dei risultati.

Feature di Input

Il gruppo Feature di input include il parametro Layer di input, che è il layer con le feature di punto che saranno raggruppate in cluster basati sulla loro distribuzione spaziale.

Per input di feature, sotto il nome del layer viene visualizzato un conteggio delle feature. Il conteggio include tutte le feature del layer, eccetto quelle che sono state rimosse con un filtro. Le impostazioni ambiente, ad esempio Estensione elaborazione, non si riflettono nel conteggio di feature.

Nota:

Web Mercator non è una proiezione appropriata per l'analisi spaziale. Se il sistema di riferimento spaziale del layer di input è WGS 1984 Web Mercator (Sfera ausiliaria), i dati saranno convertiti in un sistema di coordinate geografico, al fine di utilizzare le distanze cordali nell'analisi.

Impostazioni cluster

Il gruppo Impostazioni cluster include i seguenti parametri:

  • Metodo di clustering specifica il metodo che sarà usato per identificare i cluster.
    • Distanza definita (DBSCAN)—Identifica i cluster ricercando entro una distanza di ricerca specifica. Questo metodo è appropriato quando tutti i cluster significativi presentino densità simili.
    • Regolazione automatica (HDBSCAN)—Usa un range di distanze per separare i cluster di diverse densità da disturbo più scarso. Questo metodo è il più basato sui dati dei metodi di clustering, quindi non necessita di una distanza di ricerca.
    • Multiscala (OPTICS)—Identifica cluster usando la distanza tra vicini e un grafico di raggiungibilità. Il metodo determina innanzitutto la distanza minima di raggiungibilità per tutti i punti. La distanza minima di raggiungibilità è la distanza da un punto al suo vicino più vicino che non è stato ancora visitato dalla ricerca. Una volta determinata la distanza minima di raggiungibilità per tutti i punti, lo strumento costruisce un grafico di raggiungibilità. Il grafico di raggiungibilità traccia l'ordine di raggiungibilità di ciascun punto e la relativa distanza di raggiungibilità rivelando la struttura di raggruppamento dei punti. Questo metodo quindi usa il valore Sensibilità cluster per identificare i cluster. Simile al metodo HDBSCAN, il metodo OPTICS può identificare cluster con densità variabili.
  • Punti minimi per cluster è il numero minimo di punti utilizzato per considerare un raggruppamento di punti un cluster. In generale, minore è il valore, maggiore sarà il numero di cluster rilevati. Questo valore deve essere minore o uguale al numero di punti nel layer. Il valore minimo supportato è 2.
  • Distanza di ricerca specifica la distanza massima intorno a ogni punto da considerare. Se il valore Metodo di clustering è Distanza definita (DBSCAN), il valore Distanza di ricerca è la distanza massima intorno a ogni feature di punto nel cluster per ricercare i punti che possono essere inclusi nel cluster. Se è possibile trovare il numero minimo di punti entro la distanza di ricerca di un determinato punto, quel punto è considerato un punto cardine. Se non è possibile trovare il numero minimo di punti entro la distanza di ricerca di un determinato punto, ma quel punto rientra nella distanza di ricerca di un punto cardine, il punto è considerato un punto di confine. I cluster saranno composti sia da punti cardine sia da punti di confine. Se il valore Metodo di clustering è Multiscala (OPTICS), il valore Distanza di ricerca è la distanza massima intorno a ogni punto per ricercare i punti che possono essere assegnati a una distanza di raggiungibilità. La distanza di raggiungibilità è la distanza da un punto al suo vicino più vicino che non è stato ancora visitato dalla ricerca. Ai punti all'interno della distanza centrale di un punto viene assegnata la distanza centrale come distanza di raggiungibilità. La distanza centrale di un punto è una misura della distanza necessaria per viaggiare da ciascun punto al numero minimo definito di caratteristiche.
  • Unità distanza di ricerca è l'unità per il valore Distanza di ricerca.
  • Il Campo tempo è il campo del layer di input che contiene un timestamp per ogni feature. Questo parametro è disponibile se il valode di Metodo di clustering è Distanza definita (DBSCAN) o Multiscala (ottica). Se è specificato un valore per Campo tempo, è necessario inoltre fornire un valore per Distanza di ricerca e Unità di distanza di ricerca.
  • Intervallo tempo di ricerca è l'intervallo di tempo che verrà utilizzato per determinare le feature di un cluster spaziotemporale. L'intervallo del tempo di ricerca si estende prima e dopo il tempo di ogni feature; ad esempio, un intervallo di tempo di ricerca di 3 giorni attorno a una feature includerà tutte le feature partendo da 3 giorni prima e terminando a 3 giorni dopo il tempo della feature.
  • Unità tempo di ricerca sono le unità per l'Intervallo tempo di ricerca.
  • Sensibilità cluster è il modo in cui la forma (sia pendenza che altezza) dei picchi all'interno del grafico di raggiungibilità verrà utilizzata per separare i cluster. Il grafico di raggiungibilità traccia l'ordine di raggiungibilità dei punti e la loro distanza di raggiungibilità. Un valore di Sensibilità cluster molto alto (vicino a 100) tratterà anche i picchi più piccoli nel grafico di raggiungibilità come una separazione tra cluster. Un valore di Sensibilità cluster molto basso (vicino a 0) tratterà solo i picchi più ripidi e più alti nel grafico di raggiungibilità come una separazione tra i cluster. Se lasciato vuoto, lo strumento troverà un valore di sensibilità utilizzando la divergenza Kullback-Leibler.

Layer risultato

Il gruppo Layer risultato include i seguenti parametri:

  • Nome output specifica il nome del layer creato e visualizzato. Il nome deve essere unico. Se un layer con lo stesso nome esiste già nell'organizzazione, lo strumento non funzionerà e verrà chiesto di utilizzare un nome diverso.
  • Salva nella cartella specifica il nome di una cartella in I miei contenuti in cui verrà salvato il risultato.

Ambienti

Le impostazioni degli ambienti di analisi sono parametri aggiuntivi che influiscono sui risultati dello strumento. È possibile accedere alle impostazioni dello strumento dal gruppo di parametri Impostazioni ambiente.

Questo strumento rispetta i seguenti ambienti di analisi:

Crediti

Questo strumento consuma crediti.

Utilizzare Stima crediti per calcolare il numero di crediti necessari per eseguire lo strumento. Per maggiori informazioni, vedere Comprendere i crediti per l'analisi spaziale.

Output

Lo strumento genera un layer punto. Se il valore del parametro Metodo di clustering è Autoregolazione (HDBSCAN) o Multiscala (OPTICS), lo strumento produrrà anche un grafico. Il layer di output di tutte le opzioni Metodo di clustering includerà i campi Cluster ID, Source ID e Color ID. Il campo Cluster ID identifica il cluster a cui appartiene ogni punto. I punti di disturbo avranno un valore di -1. Il valore di campo Source ID è un identificatore unico. Il valore di campo Color ID rappresenta il colore assegnato a un punto e il suo cluster. Se il layer di output include più di nove cluster, verranno assegnati più cluster a ciascun colore. Tuttavia, ai cluster vicini verranno assegnati colori diversi per tenerli visivamente distinti. Se il valore parametro Metodo di clustering è Regolazione automatica (HDBSCAN), il layer del punto di output conterrà i seguenti campi aggiuntivi:

  • Probability è un valore tra 0 e 1 che indica la probabilità che un punto appartenga al cluster assegnato. I punti di disturbo avranno un valore pari a 0.
  • Outlier è un valore tra 0 e 1 che indica se un punto può essere un outlier all'interno del proprio cluster. I punti di disturbo saranno considerati un unico cluster. Un valore elevato indica che è più probabile che il punto sia un outlier.
  • Exemplar è un valore tra 0 e 1 che indica se un punto è più rappresentativo del relativo cluster.
  • Stability è un valore che riflette la persistenza di ciascun cluster in un intervallo di scale. Un valore maggiore indica che il cluster persiste in un intervallo più ampio di scale di distanza.

Se il valore parametro Metodo di clustering è Multiscala (OPTICS), il layer di output includerà i seguenti campi aggiuntivi:

  • Reachability order è il modo in cui le feature di input sono state ordinate per l'analisi
  • Reachability distance è la distanza tra ogni punto e il suo vicino non visitato più prossimo.

Se il valore del parametro Metodo di clustering è Autoregolazione (HDBSCAN) o Multiscala (OPTICS), lo strumento produrrà un grafico. Multiscala (OPTICS) produce un diagramma di raggiungibilità che può essere utilizzato per valutare la densità di ciascun cluster. Autoregolazione (HDBSCAN) produce un grafico di distribuzione della probabilità di appartenenza, che mostra la distribuzione della probabilità che una feature appartenga al cluster assegnato. Per visualizzare il grafico, cliccare su Grafici sulla barra degli strumenti Contenuti.

Se è specificato un valore per Campo tempo, l'output includerà un grafico Intervallo temporale per cluster che mostra l'intervallo temporale per ciascun cluster spaziotemporale. Per visualizzare il grafico, cliccare su Grafici sulla barra degli strumenti Contenuti. Il layer di output includerà anche i seguenti campi che riepilogano l'intervallo del cluster a cui appartiene ciascun punto:

  • Tempo di inizio è il tempo iniziale del cluster a cui appartiene la feature.
  • Tempo di fine è il tempo finale a cui appartiene la feature.
  • Tempo medio è il tempo medio del cluster a cui appartiene la feature.
  • Esagerazione tempo

È possibile utilizzare questi campi per visualizzare i cluster spaziotemporali nel tempo abilitando il tempo nel layer e poi utilizzando il cursore.

Per abilitare il tempo nel layer in Map Viewer, fare clic su Layer nella barra degli strumenti Contenuti. Fare clic sul layer. Nella barra degli strumenti Impostazioni, fare clic su Proprietà. Espandere il menu a discesa Informazioni. Fare clic sul layer in Layer di origine. Verrà aperta la pagina dell'elemento del layer. Nella scheda Panoramica, fare clic su Modifica in Impostazioni temporali. Viene visualizzata la finestra Impostazioni temporali. Selezionare la casella di controllo Abilita variazioni temporali Scegliere Eventi specifici nel tempo, poi scegliere Tempo medio come Campo di tempo.

Per abilitare il tempo nel layer in Scene Viewer, fare clic su Gestione layer nella barra degli strumenti Designer. Fare clic su Opzioni Strumento impostazioni layer e fare clic su Proprietà layer. In Tempo, attivare il pulsante Periodo di visibilità layer per espandere il periodo di tempo. In Inizio, fornire data e ora di inizio per la visibilità del layer. In Fine, fornire data e ora di fine per la visibilità del layer.

Per visualizzare ulteriori dettagli sull'analisi, aprire il riquadro Cronologia e trovare e fare clic sull'esecuzione riuscita dello strumento. I dettagli dell'analisi si aprono nella scheda Risultati. La scheda Risultati includerà ulteriori dettagli sull'analisi. È possibile visualizzare altri dettagli anche nella pagina dell'elemento del layer. Fare clic sul pulsante opzioni accanto al layer di output e fare clic su Visualizza dettagli.

Nota:

In ModelBuilder è possibile visualizzare i dettagli aggiuntivi dell'analisi solo nella pagina dell'elemento del layer di output.

Requisiti per la licenza

Questo strumento richiede il seguente tipo di utente e le seguenti configurazioni:

  • Creator, Professional, o tipo di utente Professional Plus
  • Ruolo Publisher, Facilitator o Amministratore, o un ruolo personalizzato equivalente

Risorse

Usare le seguenti risorse per saperne di più: