Utilizzare Crea modello di regressione

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

Lo strumento Crea modello di regressione è usato per modellare il rapporto tra due o più variabili esplicative e una variabile di risposta adattando un’equazione lineare ai dati osservati. Ogni valore della variabile indipendente (x) viene associato a un valore della variabile dipendente (y).

Lo strumento Crea modello di regressione impiega il tipo di regressione dei quadrati minimi ordinari (OLS).

Esempio

Un'organizzazione ambientale sta studiando la causa delle emissioni di gas serra per ciascun paese dal 1990 al 2015. La funzionalità Crea Modello di Regressione può essere usata per creare un'equazione che possa stimare la quantità di emissioni di gas serra per paese, in base a delle variabili esplicative come la popolazione e il prodotto interno lordo.

Eseguire Crea modello di regressione

Attenersi alla seguente procedura per creare un modello di regressione:

  1. Creare una mappa, un grafico o una tabella utilizzando il dataset con il quale si vuole creare un modello di regressione.
  2. Fare clic sul pulsante Azione Azione.
  3. Effettuare una delle seguenti operazioni:
    • Per schede a grafico o a tabella, fare clic su Come è correlato? nel riquadro Analisi.
    • Per una scheda mappa, fare clic sulla scheda Trova risposte e fare clic su Come è correlato?.
  4. Fare clic su Crea modello di regressione.
  5. Per Scegliere un layer, selezionare il dataset da usare per creare un modello di regressione.
  6. Per Scegliere una variabile dipendente, scegliere il campo che si vuole descrivere con il proprio modello.

    Il campo deve essere numerico o di frequenza/rapporto.

  7. Fare clic su Seleziona variabili descrittive per visualizzare un menu di campi disponibili.
  8. Selezionare i campi da utilizzare come variabili descrittive (anche chiamate variabili indipendenti).
  9. Fare clic su Seleziona per applicare le variabili descrittive.
  10. Fare clic sul pulsante Visualizza per visualizzare un grafico a dispersione o una matrice del grafico a dispersione delle variabili dipendenti e descrittive, se disponibili.
    I grafici a dispersione possono essere utilizzati come parte dell'analisi descrittiva per il modello.
    Nota:

    Il pulsante Visualizza non è disponibile se vengono scelte cinque o più variabili descrittive.

  11. Fare clic su Esegui.

Il modello di regressione viene creato per le variabili dipendenti e descrittive specificate. Ora è possibile utilizzare gli output e le statistiche per continuare a verificare la validità del modello con analisi di conferma e di esplorazione.

Note sull'utilizzo

Per accedere a Crea modello di regressione, fare clic sul pulsante Azione Azione sotto Come è correlato? nella scheda Trova risposte.

Come variabile dipendente, si può specificare un campo numerico o un campo frequenza/rapporto. La variabile dipendente è il campo numerico che si sta tentando di spiegare attraverso il modello di regressione. Ad esempio, se si sta creando un modello di regressione per determinare le cause della mortalità infantile, il tasso di mortalità infantile funge da variabile dipendente.

Come variabili descrittive, è possibile specificare fino a 20 campi numerici o campi frequenza/rapporto. Le variabili descrittive sono variabili indipendenti che possono essere specificate come parte del modello di regressione per spiegare la variabile dipendente. Ad esempio, se si sta creando un modello di regressione per determinare le cause della mortalità infantile, le variabili esplicative possono includere il tasso di povertà, di malattia e di vaccinazione. Se il numero di variabili descrittive scelte è uguale o inferiore a quattro, è possibile creare un grafico a dispersione o una matrice di grafici a dispersione facendo clic su Visualizza.

I seguenti valori di output sono disponibili in Statistiche modello:

  • Equazione di regressione
  • R2
  • R2 aggiustato
  • Test di Durbin-Watson
  • Valore P
  • Errore standard residuo
  • statistica F

Gli output e le statistiche possono essere usati per analizzare la precisione del modello.

Dopo aver creato il modello, un nuovo dataset di funzioni viene aggiunto al riquadro dei dati. Il dataset di funzioni potrà essere usato con la funzionalità Predici variabile. Crea Modello di Regressione crea anche un dataset di risultati che include tutti i campi dall'input, più i campi estimated, residual, e standardized_residual. Le informazioni contenute nei campi sono le seguenti:

  • estimated—Il valore della variabile dipendente come stimato dal modello di regressione
  • residual—La differenza fra il valore del campo originale e il valore stimato della variabile dipendente
  • standardized_residual—Il rapporto tra la deviazione residua e standard del residuo

Come funziona lo strumento Crea modello di regressione

Un modello di regressione OLS può essere creato se sono soddisfatte le seguenti ipotesi:

  • Il modello deve essere lineare nei parametri.
  • I dati prevengono da un campione casuale della popolazione.
  • Le variabili indipendenti non sono fortemente collineari.
  • Le variabili indipendenti sono misurate con precisione, in modo da rendere l'errore di misurazione trascurabile.
  • Il valore previsto dei residui è sempre zero.
  • I residui hanno una varianza costante (varianza omogenea).
  • I residui sono distribuiti normalmente.

Crea modello di regressione spesso si esegue correttamente anche se non si soddisfano una o più ipotesi. Le ipotesi per OLS dovrebbero essere testate prima di utilizzare Crea modello di regressione. Se le ipotesi non vengono soddisfatte, il modello potrebbe non essere valido.

Non è possibile creare un modello se la terza ipotesi (le variabili indipendenti non sono fortemente collineari) non è soddisfatta. In quel caso, il messaggio Due o più variabili esplicative sono correlate. Rimuovere una delle variabili collineari e riprovare. appare. È possibile stabilire quali variabili sono collineari usando un grafico a dispersione o una matrice di grafici a dispersione. Le variabili collineari avranno una relazione lineare e una delle variabili dipenderà fortemente dall'altra. Rimuovere la variabile collineare dipendente dal modello.

Per ulteriori informazioni sulle ipotesi dei modelli OLS, consultare Analisi di regressione.