Vengono creati come output di Crea modello di regressione. Un dataset di funzioni contiene l'equazione e le statistiche di un modello di regressione.
Utilizzare un dataset di funzioni
I dataset di funzioni vengono utilizzati come modello di regressione di input per Predici variabile. È possibile aprire Predici variabile trascinando un dataset di funzioni sulla scheda di una mappa.
È possibile creare un grafico di punti che mostra i coefficienti e gli intervalli di affidabilità per l'intercettazione e ogni variabile esplicativa espandendo un dataset di funzioni nel riquadro dei dati e facendo clic su Visualizza intervalli di affidabilità.
Suggerimento:
Trascinare un dataset di funzioni sul grafico di punti creato da un modello di regressione differente, per confrontare gli intervalli di affidabilità per le variabili esplicative fra i modelli.
Statistiche
I dataset di funzioni memorizzano l'equazione e le statistiche da un modello di regressione. Le statistiche possono essere visualizzate espandendo il dataset di funzioni nel riquadro dati o aprendo la tabella dati.
Sono disponibili le seguenti statistiche nel riquadro dati:
Statistica | Descrizione |
---|---|
Equazione di regressione | L’equazione di regressione è nel seguente formato:
dove y è la variabile dipendente, bn rappresenta i parametri calcolati e xn rappresenta le variabili esplicative. |
R2 | Il valore R2, noto anche come coefficiente di determinazione, è un numero compreso tra 0 e 1 che misura in che misura la linea di miglior adattamento modella i punti dati, con i valori più vicini a 1 che indicano i modelli più accurati. |
R2 aggiustato | Il valore R2 regolato è anch’esso una misura compresa tra 0 e 1, ma tiene conto di ulteriori variabili predittive che potrebbero causare un adattamento migliore in un modello basato sulla sola probabilità. Pertanto, l’uso del valore R2 aggiustato è consigliabile quando il modello dispone di un gran numero di variabili predittive oppure quando si confrontano modelli con un diverso numero di variabili predittive. |
Durbin-Watson | Il test di Durbin-Watson misura l'autocorrelazione nei residui da un'analisi di regressione, su una scala da 0 a 4. In questa scala, da 0 a 2 l'autocorrelazione è positiva, 2 non ha autocorrelazione e da 2 a 4 l'autocorrelazione è negativa. Avere una bassa autocorrelazione in un modello di regressione è preferibile, in quanto i valori del test di Durbin-Watson più vicini a 2 sono più favorevoli. Nota:Il calcolo del test di Durbin-Watson dipende dall’ordine dei dati. È importante che i dati siano ordinati in modo sequenziale, specialmente se riguardano il tempo. Se i dati non sono ordinati in modo corretto, il valore del test di Durbin-Watson potrebbe non essere accurato. |
Errore standard residuo | L'errore standard residuo misura l'accuratezza con cui il modello di regressione può prevedere i valori con nuovi dati. Valori più piccoli indicano un modello più accurato. Il valore dei gradi di libertà residui è mostrato anche con l'errore standard residuo. |
statistica F | La statistica F viene utilizzata per determinare la capacità predittiva del modello di regressione stabilendo se i coefficienti sono significativamente diversi da 0. La statistica F è un valore maggiore o uguale a 0 e comprende due valori per i gradi di libertà. Il primo è il grado di libertà per le variabili esplicative, il secondo è il grado di libertà per i residui. |
Valore P | Il valore p per la statistica F è un test di rilevanza globale per il modello di regressione. Un valore p è rappresentato come un valore compreso tra 0,0 e 1,0. Valori compresi tra 0 e 0,05 indicano che il modello globale è statisticamente rilevante. |
Sono disponibili le seguenti statistiche nella tabella dati:
Statistica | Descrizione |
---|---|
Variabile | L'intercettazione e i nomi delle variabili esplicative. |
Coefficiente | I valori b per l'equazione di regressione, che corrispondono all'intercettazione y e alla pendenza per ogni variabile esplicativa. |
Errore standard | L'errore standard misura la variazione di ciascuno delle predittive utilizzate nel modello. Valori più piccoli indicano predittive più accurate. |
valore t | Il valore t viene utilizzato per determinare la capacità predittiva del coefficiente di regressione determinando se i coefficienti sono significativamente diversi da 0. |
Valore P | Il valore p è correlato al valore t e verifica la rilevanza locale per i coefficienti in un modello di regressione. Un valore p è un valore compreso tra 0,0 e 1,0. Valori compresi tra 0,0 e 0,05 indicano che il coefficiente è statisticamente rilevante. |
Intervallo di affidabilità | Gli intervalli di affidabilità forniscono i limiti superiore e inferiore entro i quali è possibile avere un certo grado di certezza che il coefficiente rientri nell'intervallo. Ad esempio, se l'intervallo di affidabilità inferiore al 95% è 10 e l'intervallo di affidabilità superiore al 95% è 15, è possibile avere il 95% di affidabilità che il valore reale del coefficiente sia compreso tra 10 e 15. I seguenti intervalli di affidabilità sono rappresentati nella tabella dati:
|
Coefficienti standardizzati | I coefficienti standardizzati sono calcolati standardizzando i dati in modo che la varianza delle variabili dipendenti ed esplicative sia pari a 1. I coefficienti standardizzati sono particolarmente utili per confrontare i valori dei coefficienti con diverse unità di misura. |
Intervalli di affidabilità standardizzati | Gli intervalli di affidabilità standardizzati forniscono i limiti superiore e inferiore entro i quali è possibile avere un certo grado di certezza che il coefficiente standardizzato rientri nell'intervallo. I seguenti intervalli di affidabilità standardizzati sono rappresentati nella tabella dati:
|
Per ulteriori informazioni su come utilizzare e interpretare gli output statistici in un dataset funzionale, vedere Analisi di regressione.