Crea modello di regressione

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

Lo strumento Crea modello di regressione è usato per definire il rapporto tra due o più variabili esplicative e una variabile di risposta adattando un’equazione lineare ai dati osservati. Ogni valore della variabile indipendente (x) viene associato a un valore della variabile dipendente (y).

Lo strumento Crea modello di regressione impiega il tipo di regressione dei quadrati minimi ordinari (OLS).

Esempio

Un'organizzazione ambientale sta studiando la causa delle emissioni di gas serra per ciascun paese dal 1990 al 2015. La funzionalità Crea Modello di Regressione può essere usata per creare un'equazione che possa stimare la quantità di emissioni di gas serra per paese, in base a delle variabili esplicative come la popolazione e il prodotto interno lordo (PIL).

Utilizzare la funzionalità Crea modello di regressione

Attenersi alla seguente procedura per eseguire la funzionalità di analisi Crea modello di regressione:

  1. Creare una mappa, un grafico o una tabella utilizzando il dataset con il quale si vuole creare un modello di regressione.
  2. Fare clic sul pulsante Azione Azione.
  3. Effettuare una delle seguenti operazioni:
    • Se la scheda è un grafico o una tabella, fare clic su Com'è correlato nel riquadro Analisi.
    • Se la scheda è una mappa, fare clic sulla scheda Trova risposte e fare clic su Com'è correlato.
  4. Fare clic su Crea modello di regressione.
  5. Per Scegliere un layer, selezionare il dataset con il quale si vuole creare un modello di regressione.
  6. Per Scegliere una variabile dipendente, scegliere il campo che si vuole descrivere con il proprio modello. Il campo deve essere numerico o di frequenza/rapporto.
  7. Fare clic su Seleziona variabili descrittive per visualizzare un menu di campi disponibili.
  8. Selezionare i campi da utilizzare come variabili descrittive (anche chiamate variabili indipendenti).
  9. Fare clic su Seleziona per applicare le variabili descrittive.
  10. Fare clic sul pulsante Visualizza per visualizzare un grafico a dispersione o una matrice del grafico a dispersione delle variabili dipendenti e descrittive, se disponibili. I grafici a dispersione possono essere utilizzati come parte dell'analisi descrittiva per il proprio modello.
    Nota:

    Il pulsante Visualizza non è disponibile se vengono scelte cinque o più variabili descrittive.

  11. Fare clic su Esegui.

Il modello di regressione viene creato per le variabili dipendenti e descrittive scelte. Ora è possibile utilizzare gli output e le statistiche per continuare a verificare la validità del modello con analisi di conferma e di esplorazione.

Note sull'utilizzo

Crea Modello di Regressione si può trovare utilizzando il tasto Azione Azione sotto Com'è correlato? sulla scheda Trova risposte.

Come variabile dipendente, deve essere selezionato un campo numerico o un campo frequenza/rapporto. La variabile dipendente è il campo numerico che si sta tentando di spiegare attraverso il modello di regressione. Ad esempio, se si sta creando un modello di regressione per determinare le cause della mortalità infantile, il tasso di mortalità infantile funge da variabile dipendente.

Come variabili esplicative, possono essere selezionati fino a 20 campi numerici o campi frequenza/rapporto. Le variabili esplicative sono variabili indipendenti che possono essere selezionate come parte del modello di regressione per spiegare la variabile dipendente. Ad esempio, se si sta creando un modello di regressione per determinare le cause della mortalità infantile, le variabili esplicative possono includere il tasso di povertà, di malattia e di vaccinazione. Se il numero di variabili descrittive scelte è uguale o inferiore a quattro, è possibile creare un grafico a dispersione o una matrice di grafici a dispersione facendo clic su Visualizza.

I seguenti valori di output sono mostrati in Statistiche modello:

  • Equazione di regressione
  • R2
  • R2 aggiustato
  • Test di Durbin-Watson
  • Valore P
  • Errore standard residuo
  • statistica F

Gli output e le statistiche possono essere usati per analizzare la precisione del modello.

Dopo aver creato il modello, un nuovo dataset di funzioni viene aggiunto al riquadro dei dati. Il dataset di funzioni potrà essere usato con la funzionalità Predici variabile. Crea Modello di Regressione crea anche un dataset di risultati che include tutti i campi dall'input, più i campi estimated, residual, e standardized_residual. Le informazioni contenute nei campi sono le seguenti:

  • estimated—Il valore della variabile dipendente come stimato dal modello di regressione
  • residual—La differenza fra il valore del campo originale e il valore stimato della variabile dipendente
  • standardized_residual—Il rapporto tra la deviazione residua e standard del residuo

Come funziona lo strumento Crea modello di regressione

È possibile creare un modello OLS (minimi quadrati) se vengono soddisfatti i seguenti presupposti:

  • Il modello deve essere lineare nei parametri.
  • I dati prevengono da un campione casuale della popolazione.
  • Le variabili indipendenti non sono troppo fortemente collineari.
  • Le variabili indipendenti sono state misurate con precisione, in modo da rendere l'errore di misurazione trascurabile.
  • Il valore previsto dei residui è sempre zero.
  • I residui hanno una varianza costante (varianza omogenea).
  • I residui sono distribuiti normalmente.

Crea modello di regressione spesso si esegue correttamente anche se non si soddisfano una o più ipotesi. Quindi, le ipotesi di OLS devono essere testate prima di usare Crea modello di regressione. Se le ipotesi non vengono soddisfatte, il modello potrebbe non essere valido.

Non è possibile creare un modello se non si soddisfa la terza ipotesi (variabili indipendenti non sono troppo fortemente collineari). In quel caso, il messaggio Due o più variabili esplicative sono correlate. Viene visualizzato il messaggio Rimuovere una delle variabili collineari e riprovare . È possibile stabilire quali variabili sono collineari usando un grafico a dispersione o una matrice di grafici a dispersione. Le variabili collineari avranno una relazione lineare e una delle variabili dipenderà fortemente dall'altra. Rimuovere la variabile collineare dipendente dal modello.

Per ulteriori informazioni sulle ipotesi dei modelli OLS, consultare Analisi di regressione.