Analisi dei collegamenti—ArcGIS Insights

L’analisi dei collegamenti è una tecnica di analisi focalizzata sulle relazioni e le connessioni all’interno di un dataset. L’analisi dei collegamenti offre la possibilità di calcolare le misure principali, ovvero gradi, centralità vicinanza e autovettore, e di visualizzare le connessioni su un grafico di collegamento o una mappa di collegamento.

Informazioni sull'analisi dei collegamenti

L’analisi dei collegamenti utilizza una rete di collegamenti interconnessi e nodi per identificare ed analizzare le relazioni che non vengono visualizzate facilmente nei dati non elaborati. I tipi più comuni di rete sono inclusi tra i seguenti:

Reti sociali che mostrano chi parla con chi
Reti semantiche che illustrano argomenti correlati tra loro
Reti di conflitto che indicano alleanze di connessioni tra i giocatori
Reti di compagnie aeree che indicano quali aeroporti hanno voli di collegamento

Esempi

Un criminologo sta facendo un’investigazione sulla rete criminale. Dati provenienti da registri di un telefono cellulare possono essere utilizzati per determinare il tipo di relazione e la gerarchia presente tra i membri della rete.

Una società di carte di credito sta sviluppando un nuovo sistema per rilevare il furto di carte di credito. Il sistema utilizza i movimenti ricorrenti delle transazioni di ogni cliente, come la città, i negozi, ed i tipi di transazioni, per identificare le anomalie e avvertire il cliente di un potenziale furto.

Un analista della salute pubblica sta facendo una ricerca sulla crisi degli oppiacei nell’America del Nord. L’analista utilizza i dati riguardanti le prescrizioni e la demografia per identificare nuovi movimenti che emergono con il diffondersi della crisi.

Come funziona l’analisi dei collegamenti

La tabella di seguito fornisce una panoramica della terminologia nell’analisi dei collegamenti:


Periodo	Descrizione	Esempi
Rete	Una serie di nodi e collegamenti connessi tra di loro.	Un social network online, che utilizza una rete di profili e relazioni per connettere gli utenti. Reti di una compagnia aerea, che utilizzano una rete di aeroporti e voli per trasportare i viaggiatori dalla partenza fino alla destinazione.
Nodo	Un punto o vertice che rappresenta un oggetto: una persona, un posto, un tipo di reato o un tweet. Il nodo può includere anche proprietà associate.	I profili all’interno di un social network. Le proprietà associate possono includere il nome dell’utente, città di provenienza o datore di lavoro. Gli aeroporti in una rete di una compagnia aerea. Le proprietà associate possono includere il nome dell’aeroporto.
Collega	Le relazioni o le connessioni tra nodi. Il collegamento può includere anche proprietà associate.	Le relazioni tra profili in una rete, come amici, seguaci o connessioni. Le proprietà associate possono includere la lunghezza della relazione. I voli tra aeroporti in una rete di una compagnia aerea. Le proprietà associate possono includere il numero di voli tra aeroporti.

di betweenness

La centralità è una misura di importanza per i nodi in una rete.

La centralità generale viene utilizzata per i seguenti scopi:

Per valutare l’influenza di un nodo su altri noti nella rete. Per esempio, quale utente raggiungerà la maggior parte di utenti condividendo una notizia o un’opportunità di lavoro?
Per identificare i nodi che sono più influenzati da altri nodi. Per esempio, quale aeroporto sarà più colpito da voli cancellati da una tempesta in un'altra regione?
Per osservare il flusso di diffusione di qualcosa in tutta la rete, tra cui informazioni, oggetti o fenomeni. Per esempio, come si muove un pacchetto dal magazzino all’indirizzo di consegna?
Per capire quali nodi diffondono più efficacemente i fenomeni nella rete. Per esempio, quale giornale o canale dovrebbe essere contattato affinché una notizia raggiunga il maggior numero di persone possibile?
Posizionare nodi può bloccare o impedire la diffusione di fenomeni. Per esempio, dove dovrebbero essere posizionati i centri di vaccinazione per bloccare la diffusione di un virus?

Vi sono quattro modi per misurare la centralità in Insights: la centralità di grado, la centralità della centralità, la centralità di vicinanza e la centralità autovettore.

I calcoli per le centralità, vicinanza e autovettore possono essere ponderati o non ponderati.

Centralità di grado

La centralità di grado si basa sul numero di connessioni dirette che possiede un nodo. La centralità di grado dovrebbe essere utilizzata per determinare quali nodi possiedono un’influenza più diretta. Per esempio, in una rete sociale, gli utenti con più connessioni hanno una centralità di grado più alta.

La centralità di grado del nodo x viene calcolata utilizzando la seguente equazione:

degCentrality(x)=deg(x)/(Nodi_Totale-1)

dove:

Nodi_Totale = Il numero di nodi nella rete
deg(x) = Il numero di nodi connessi al nodo x

Se i collegamenti sono diretti, cioè l’informazione passa attraverso i nodi in una sola direzione, allora la centralità di grado può essere misurata come In-degree o Out-degree. Nel caso in social network, l’In-degree si baserebbe sul numero di profili seguiti da un utente, mentre l’Out-degree si baserebbe sul numero di seguaci che ha l’utente.

La centralità di In-degree viene calcolata utilizzando la seguente equazione:

indegCentrality(x)=indeg(x)/(Nodi_Totale-1)

dove:

Nodi_Totale = Il numero di nodi nella rete
indeg(x) = Il numero di nodi connessi al nodo x con flusso diretto verso il nodo x

La centralità di Out-degree viene calcolata utilizzando la seguente equazione:

outdegCentrality(x)=outdeg(x)/(Nodi_Totale-1)

dove:

Nodi_Totale = Il numero di nodi nella rete
outdeg(x) = Il numero di nodi connessi al nodo x con un flusso diretto lontano dal nodo x

Per i grafici diretti, Insights dà una dimensione ai nodi tramite la centralità di Out-degree predefinita.

Centralità della centralità

La centralità della centralità si basa su questo concetto: fino a che punto un nodo fa parte del percorso più breve tra altri nodi. La centralità della centralità dovrebbe essere utilizzata per determinare quali nodi vengono utilizzati per connettere altri nodi tra di loro. Per esempio, un utente in un social network con connessioni a molteplici gruppi di amici avrà una centralità della centralità maggiore rispetto ad utenti con connessioni ad un solo gruppo.

La centralità della centralità del nodo x viene calcolata utilizzando la seguente equazione:

btwCentrality(x)=Σ_a,bϵNodi(percorsi_a,b(x)/percorsi_a,b)

dove:

Nodi = Tutti i nodi nella rete
percorsi_a,b = Il numero di percorsi più breve tra tutti i nodi a e b
percorsi_a,b(x) = Il numero di percorsi più brevi tra nodi a e b che si connettono tramite il nodo x

L’equazione della centralità della centralità mostrata precedentemente non rappresenta la dimensione della rete, per questa ragione le grandi reti avranno valori di centralità della centralità maggiori rispetto a delle reti piccole. Per consentire un paragone tra reti di diverse dimensioni, l’equazione della centralità della centralità deve essere normalizzata dividendo il numero di coppie di nodi nel grafico.

La seguente equazione viene utilizzata per normalizzare un grafico indiretto:

1/2(Nodi_Totale-1)(Nodi_Totale-2)

dove:

Nodi_Totale = Il numero di nodi nella rete

La seguente equazione viene utilizzata per normalizzare un grafico diretto:

(Nodi_Totale-1)(Nodes_Total-2)

dove:

Nodi_Totale = Il numero di nodi nella rete

Centralità di vicinanza

La centralità di vicinanza di basa sulla media della distanza di percorso di rete più corta tra i nodi. La centralità di vicinanza dovrebbe essere utilizzata per determinare quali nodi si presentano come associati più vicini ad altri noti nella rete. Per esempio, un utente con più connessioni nella rete sociale avrà una centralità di vicinanza più alta di un utente che è connesso attraverso altre persone (in altre parole, un amico di un amico).

Nota:

La distanza tra nodi fa riferimento al numero di collegamenti che li separano, non alla distanza geografica.

La centralità di vicinanza del nodo x viene calcolata utilizzando la seguente equazione:

closeCentrality(x)=(nodi(x,y)/(Nodi_Totale-1))*(nodi(x,y)/dist(x,y)_Totale)

dove:

Nodi_Totale = Il numero di nodi nella rete
nodi(x,y) = Il numero di nodi connessi al nodo x
dist(x,y)_Totale = La somma delle distanze di percorso più breve dal nodo x ad altri nodi

Centralità autovettore

La centralità autovettore si basa su nodi importanti connessi ad altri nodi importanti. La centralità autovettore deve essere utilizzata quando si desidera determinare quali nodi fanno parte di un cluster di influenza. Ad esempio, un utente in un social network con molte connessioni ad altri utenti con molte connessioni avrà una maggiore centralità autovettore rispetto a un utente con poche connessioni oppure connesso ad altri utenti con poche connessioni.

La centralità autovettore del nodo x viene calcolata utilizzando il metodo delle potenze per trovare l'autovettore più grande utilizzando la seguente equazione:

Ax=λx

dove:

λ = Autovalore
x = Autovettore
A = Matrice che descrive la trasformazione lineare

Peso segmento

I calcoli per la vicinanza, centralità degli autovettori possono essere ponderati o non ponderati. Un calcolo di centralità non ponderato imposta i bordi ad un peso uniforme con un valore di 1, mentre un calcolo ponderato usa valori di campo per assegnare un valore ad ogni bordo.

Nota:

Ai pesi indefiniti viene dato il valore 1. È una buona pratica assegnare un campo senza valori nulli o mancanti per il peso del bordo.

Per la centralità dell'autovettore, i pesi sono usati per determinare la forza della connessione tra i nodi. Poiché la centralità dell'autovettore misura l'importanza dei nodi all'interno della rete, valori di peso più alti corrispondono a valori più alti per i loro nodi di connessione.

Per le centralità di vicinanza e interrelazione, i valori dei pesi indicano la distanza tra i nodi. Pesi di bordo più alti significano una maggiore distanza tra i nodi e riducono la probabilità che il bordo sia usato nel percorso più breve. Se un numero più alto nel campo del peso desiderato indica una maggiore importanza (per esempio, il numero di messaggi inviati tra i membri in una rete sociale indica quanto sono connessi i membri), un nuovo campo deve essere calcolato con valori inversi. Usate la seguente equazione per calcolare un campo di valori inversi:

peso=ABS(campo-MAX(campo))+IF(MIN(campo)<0, ABS(MIN(campo)), MIN(campo))

Per un calcolo di vicinanza o di interrelazione non pesata, il percorso più breve è il percorso che utilizza il minor numero di link. L'esempio qui sotto mostra una rete con quattro nodi (A, B, C e D) e pesi uniformi. Ci sono due percorsi che uniscono il nodo A al nodo D: A-B-D o A-B-C-D. Poiché A-B-D ha meno collegamenti, è il percorso più breve.

Percorso più breve in una rete con bordi non pesati

Un calcolo ponderato applica dei pesi ad ogni bordo in base ai valori dei campi. La vicinanza ponderata e centralità usano l'algoritmo di Bellman-Ford per trovare i percorsi più brevi tra i nodi.

L'esempio qui sotto mostra una rete con quattro nodi e bordi ponderati. Il percorso A-B-D ha un valore di 15 e il percorso A-B-C-D ha un valore di 9. Poiché A-B-C-D ha il valore del bordo più basso, è il percorso più breve.

Il percorso più breve in una rete con bordi ponderati

I calcoli della vicinanza ponderata e della centralità centrale non supportano i cicli di pesi negativi. Se viene rilevato un ciclo di peso negativo, tutti i valori di centralità sono impostati a 0. Un ciclo di peso negativo può verificarsi nelle seguenti circostanze: