Dataset di funzioni—ArcGIS Insights

Vengono creati come output di Crea modello di regressione. Un dataset di funzioni contiene l'equazione e le statistiche di un modello di regressione.

Utilizzare un dataset di funzioni

I dataset di funzioni vengono utilizzati come modello di regressione di input per Predici variabile. È possibile aprire Predici variabile trascinando un dataset di funzioni sulla scheda di una mappa.

Un grafico di punti che mostra i coefficienti e gli intervalli di affidabilità per l'intercettazione e ogni variabile esplicativa può essere creato espandendo un dataset di funzioni nel riquadro dati e facendo clic su Visualizza intervalli di affidabilità.

Suggerimento:

Drag-N Drop Trascinare un dataset di funzioni sul grafico di punti creato da un modello di regressione differente, per confrontare gli intervalli di affidabilità per le variabili esplicative fra i modelli.

Statistiche

I dataset di funzioni memorizzano l'equazione e le statistiche da un modello di regressione. Le statistiche possono essere visualizzate espandendo il dataset di funzioni nel riquadro dati o aprendo la tabella dati.

Sono disponibili le seguenti statistiche nel riquadro dati:


Statistica	Descrizione
Equazione di regressione	L’equazione di regressione è nel seguente formato: `y=b₀+b₁x₁+b₂x₂+...+b_nx_n` dove y è la variabile dipendente, b_n rappresenta i parametri calcolati e x_n rappresenta le variabili esplicative.
R²	Il valore R², noto anche come coefficiente di determinazione, è un numero compreso tra 0 e 1 che misura in che misura la linea di miglior adattamento modella i punti dati, con i valori più vicini a 1 che indicano i modelli più accurati.
R² aggiustato	Il valore R² aggiustato è anch’esso una misura compresa tra 0 e 1, ma tiene conto di ulteriori variabili predittive che potrebbero causare un adattamento migliore in un modello basato sulla sola probabilità. Pertanto, l’uso del valore R² aggiustato è consigliabile quando il modello dispone di un gran numero di variabili predittive, oppure quando si confrontano modelli con un diverso numero di variabili predittive.
Durbin-Watson	Il test di Durbin-Watson misura l'autocorrelazione nei residui da un'analisi di regressione, su una scala da 0 a 4. In questa scala, da 0 a 2 l'autocorrelazione è positiva, 2 non ha autocorrelazione e da 2 a 4 l'autocorrelazione è negativa. Avere una bassa autocorrelazione in un modello di regressione è preferibile, in quanto i valori del test di Durbin-Watson più vicini a 2 sono più favorevoli. Nota: Il calcolo del test di Durbin-Watson dipende dall’ordine dei dati. È importante che i dati siano ordinati in modo sequenziale, specialmente se riguardano il tempo. Se i dati non sono ordinati in modo corretto, il valore del test di Durbin-Watson potrebbe non essere accurato.
Errore standard residuo	L'errore standard residuo misura l'accuratezza con cui il modello di regressione può prevedere i valori con nuovi dati. Valori più piccoli indicano un modello più accurato. Il valore dei gradi di libertà residui è mostrato anche con l'errore standard residuo.
statistica F	La statistica F viene utilizzata per determinare la capacità predittiva del modello di regressione determinando se i coefficienti sono significativamente diversi da 0. La statistica F è mostrata come valore maggiore o uguale a 0 e comprende due valori per i gradi di libertà, il primo è il grado di libertà per le variabili esplicative, e il secondo è il grado di libertà per i residui.
Valore P	Il valore p per la statistica F è un test di rilevanza globale per il modello di regressione. Un valore p è rappresentato come un valore compreso tra 0,0 e 1,0. Valori compresi tra 0 e 0,05 indicano che il modello globale è statisticamente rilevante.

Sono disponibili le seguenti statistiche nella tabella dati:


Statistica	Descrizione
Variabile	L'intercettazione e i nomi delle variabili esplicative.
Coefficiente	I valori b per l'equazione di regressione, che corrispondono all'intercettazione y e alla pendenza per ogni variabile esplicativa.
Errore standard	L'errore standard misura la variazione di ciascuno delle predittive utilizzate nel modello. Valori più piccoli indicano predittive più accurate.
valore t	Il valore t viene utilizzato per determinare la capacità predittiva del coefficiente di regressione determinando se i coefficienti sono significativamente diversi da 0.
Valore P	Il valore p è correlato al valore t e verifica la rilevanza locale per i coefficienti nel modello di regressione. Un valore p è rappresentato come un valore compreso tra 0,0 e 1,0. Valori compresi tra 0,0 e 0,05 indicano che il coefficiente è statisticamente rilevante.
Intervallo di affidabilità	Gli intervalli di affidabilità forniscono i limiti superiore e inferiore entro i quali è possibile avere un certo grado di certezza che il coefficiente rientri nell'intervallo. Ad esempio, se l'intervallo di affidabilità inferiore al 95% è 10 e l'intervallo di affidabilità superiore al 95% è 15, è possibile avere il 95% di affidabilità che il valore reale del coefficiente sia compreso tra 10 e 15. I seguenti intervalli di affidabilità sono rappresentati nella tabella dati: Inferiore al 90% Superiore al 90% Inferiore al 95% Superiore al 95% Inferiore al 99% Superiore al 99%
Coefficienti standardizzati	I coefficienti standardizzati sono calcolati standardizzando i dati in modo che la varianza delle variabili dipendenti ed esplicative sia pari a 1. I coefficienti standardizzati sono particolarmente utili per confrontare i valori dei coefficienti con diverse unità di misura.
Intervalli di affidabilità standardizzati	Gli intervalli di affidabilità standardizzati forniscono i limiti superiore e inferiore entro i quali è possibile avere un certo grado di certezza che il coefficiente standardizzato rientri nell'intervallo. I seguenti intervalli di affidabilità standardizzati sono rappresentati nella tabella dati: Inferiore al 90% Superiore al 90% Inferiore al 95% Superiore al 95% Inferiore al 99% Superiore al 99%

Per ulteriori informazioni su come utilizzare e interpretare gli output statistici in un dataset funzionale, vedere Analisi di regressione.

Qualche feedback su questo argomento?

Utilizzare un dataset di funzioni

Suggerimento:

Statistiche

Nota:

In questo argomento