Dataset di funzioni

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

Vengono creati come output di Crea modello di regressione. Un dataset di funzioni contiene l'equazione e le statistiche di un modello di regressione.

Utilizzare un dataset di funzioni

I dataset di funzioni vengono utilizzati come modello di regressione di input per Predici variabile. È possibile aprire Predici variabile trascinando un dataset di funzioni sulla scheda di una mappa.

Un grafico di punti che mostra i coefficienti e gli intervalli di affidabilità per l'intercettazione e ogni variabile esplicativa può essere creato espandendo un dataset di funzioni nel riquadro dati e facendo clic su Visualizza intervalli di affidabilità.

Suggerimento:

Drag-N Drop Trascinare un dataset di funzioni sul grafico di punti creato da un modello di regressione differente, per confrontare gli intervalli di affidabilità per le variabili esplicative fra i modelli.

Statistiche

I dataset di funzioni memorizzano l'equazione e le statistiche da un modello di regressione. Le statistiche possono essere visualizzate espandendo il dataset di funzioni nel riquadro dati o aprendo la tabella dati.

Sono disponibili le seguenti statistiche nel riquadro dati:

StatisticaDescrizione

Equazione di regressione

L’equazione di regressione è nel seguente formato:

y=b0+b1x1+b2x2+...+bnxn

dove y è la variabile dipendente, bn rappresenta i parametri calcolati e xn rappresenta le variabili esplicative.

R2

Il valore R2, noto anche come coefficiente di determinazione, è un numero compreso tra 0 e 1 che misura in che misura la linea di miglior adattamento modella i punti dati, con i valori più vicini a 1 che indicano i modelli più accurati.

R2 aggiustato

Il valore R2 aggiustato è anch’esso una misura compresa tra 0 e 1, ma tiene conto di ulteriori variabili predittive che potrebbero causare un adattamento migliore in un modello basato sulla sola probabilità. Pertanto, l’uso del valore R2 aggiustato è consigliabile quando il modello dispone di un gran numero di variabili predittive, oppure quando si confrontano modelli con un diverso numero di variabili predittive.

Durbin-Watson

Il test di Durbin-Watson misura l'autocorrelazione nei residui da un'analisi di regressione, su una scala da 0 a 4. In questa scala, da 0 a 2 l'autocorrelazione è positiva, 2 non ha autocorrelazione e da 2 a 4 l'autocorrelazione è negativa. Avere una bassa autocorrelazione in un modello di regressione è preferibile, in quanto i valori del test di Durbin-Watson più vicini a 2 sono più favorevoli.

Nota:

Il calcolo del test di Durbin-Watson dipende dall’ordine dei dati. È importante che i dati siano ordinati in modo sequenziale, specialmente se riguardano il tempo. Se i dati non sono ordinati in modo corretto, il valore del test di Durbin-Watson potrebbe non essere accurato.

Errore standard residuo

L'errore standard residuo misura l'accuratezza con cui il modello di regressione può prevedere i valori con nuovi dati. Valori più piccoli indicano un modello più accurato. Il valore dei gradi di libertà residui è mostrato anche con l'errore standard residuo.

statistica F

La statistica F viene utilizzata per determinare la capacità predittiva del modello di regressione determinando se i coefficienti sono significativamente diversi da 0. La statistica F è mostrata come valore maggiore o uguale a 0 e comprende due valori per i gradi di libertà, il primo è il grado di libertà per le variabili esplicative, e il secondo è il grado di libertà per i residui.

Valore P

Il valore p per la statistica F è un test di rilevanza globale per il modello di regressione. Un valore p è rappresentato come un valore compreso tra 0,0 e 1,0. Valori compresi tra 0 e 0,05 indicano che il modello globale è statisticamente rilevante.

Sono disponibili le seguenti statistiche nella tabella dati:

StatisticaDescrizione

Variabile

L'intercettazione e i nomi delle variabili esplicative.

Coefficiente

I valori b per l'equazione di regressione, che corrispondono all'intercettazione y e alla pendenza per ogni variabile esplicativa.

Errore standard

L'errore standard misura la variazione di ciascuno delle predittive utilizzate nel modello. Valori più piccoli indicano predittive più accurate.

valore t

Il valore t viene utilizzato per determinare la capacità predittiva del coefficiente di regressione determinando se i coefficienti sono significativamente diversi da 0.

Valore P

Il valore p è correlato al valore t e verifica la rilevanza locale per i coefficienti nel modello di regressione. Un valore p è rappresentato come un valore compreso tra 0,0 e 1,0. Valori compresi tra 0,0 e 0,05 indicano che il coefficiente è statisticamente rilevante.

Intervallo di affidabilità

Gli intervalli di affidabilità forniscono i limiti superiore e inferiore entro i quali è possibile avere un certo grado di certezza che il coefficiente rientri nell'intervallo. Ad esempio, se l'intervallo di affidabilità inferiore al 95% è 10 e l'intervallo di affidabilità superiore al 95% è 15, è possibile avere il 95% di affidabilità che il valore reale del coefficiente sia compreso tra 10 e 15.

I seguenti intervalli di affidabilità sono rappresentati nella tabella dati:

  • Inferiore al 90%
  • Superiore al 90%
  • Inferiore al 95%
  • Superiore al 95%
  • Inferiore al 99%
  • Superiore al 99%

Coefficienti standardizzati

I coefficienti standardizzati sono calcolati standardizzando i dati in modo che la varianza delle variabili dipendenti ed esplicative sia pari a 1. I coefficienti standardizzati sono particolarmente utili per confrontare i valori dei coefficienti con diverse unità di misura.

Intervalli di affidabilità standardizzati

Gli intervalli di affidabilità standardizzati forniscono i limiti superiore e inferiore entro i quali è possibile avere un certo grado di certezza che il coefficiente standardizzato rientri nell'intervallo.

I seguenti intervalli di affidabilità standardizzati sono rappresentati nella tabella dati:

  • Inferiore al 90%
  • Superiore al 90%
  • Inferiore al 95%
  • Superiore al 95%
  • Inferiore al 99%
  • Superiore al 99%

Per ulteriori informazioni su come utilizzare e interpretare gli output statistici in un dataset funzionale, vedere Analisi di regressione.