Utilizar Crear modelo de regresión

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Crear modelo de regresión modela la relación entre dos o más variables explicativas y una variable de respuesta encajando una ecuación lineal a los datos observados. Cada valor de la variable independiente (x) está asociado a un valor de la variable dependiente (y).

Crear modelo de regresión utiliza Mínimos cuadrados ordinarios (OLS) como el tipo de regresión.

Ejemplo

Una organización medioambiental está estudiando la causa de las emisiones de gases efecto invernadero por países, de 1990 a 2015. La funcionalidad Crear modelo de regresión se puede usar para crear una ecuación capaz de estimar la cantidad de emisiones de gases de efecto invernadero por países en función de variables explicativas tales como población y producto interior bruto.

Ejecutar Crear modelo de regresión

Realice los pasos siguientes para crear un modelo de regresión:

  1. Cree un mapa, gráfico o tabla con el dataset con el que desee crear un modelo de regresión.
  2. Haga clic en el botón AcciónAcción.
  3. Realice una de las siguientes acciones:
    • En las tarjetas de gráfico o tabla, haga clic en Cómo está relacionado en el panel Análisis.
    • En una tarjeta de mapa, haga clic en la pestaña Buscar respuestas y en Cómo está relacionado.
  4. Haga clic en Crear modelo de regresión.
  5. En Elegir una capa, seleccione el dataset que va a utilizar para crear un modelo de regresión.
  6. En Elegir una variable dependiente, elija el campo que desee explicar con el modelo.

    El campo debe ser numérico o de índice/ratio.

  7. Haga clic en Seleccionar variables explicativas para mostrar un menú de campos disponibles.
  8. Seleccione los campos que desee usar como variables explicativas (también llamadas variables independientes).
  9. Haga clic en Seleccionar para aplicar las variables explicativas.
  10. Haga clic en el botón Visualizar para ver un gráfico de dispersión o una matriz de gráficos de dispersión de las variables dependientes y explicativas, si las hay.
    Los gráficos de dispersión se pueden utilizar como parte del análisis exploratorio del modelo.
    Nota:

    El botón Visualizar no está disponible si se seleccionan cinco o más variables explicativas.

  11. Haga clic en Ejecutar.

Se crea el modelo de regresión de las variables dependientes y explicativas especificadas. Ahora puede utilizar las salidas y estadísticas para seguir verificando la validez del modelo con análisis exploratorios y confirmatorios.

Notas de uso

Para acceder a Crear modelo de regresión, haga clic en el botón Acción Acción en Cómo está relacionado en la pestaña Buscar respuestas.

Puede especificar un campo numérico o de índice/ratio como la variable dependiente. La variable dependiente es el campo numérico que intenta explicar con el modelo de regresión. Por ejemplo, si va a crear un modelo de regresión para determinar las causas de la mortalidad infantil, el índice de mortalidad infantil es la variable dependiente.

Puede especificar hasta 20 campos numéricos o de índice/ratio como variables explicativas. Las variables explicativas son variables independientes que se pueden especificar como parte del modelo de regresión para explicar la variable dependiente. Por ejemplo, si va a crear un modelo de regresión para determinar las causas de la mortalidad infantil, las variables explicativas pueden incluir índices de pobreza, índices de enfermedades e índices de vacunación. Si el número de variables explicativas es cuatro o menos, puede crear un gráfico de dispersión o una matriz de gráficos de dispersión haciendo clic en Visualizar.

En Estadísticas del modelo se encuentran disponibles los siguientes valores de salida:

  • Ecuación de regresión
  • R2
  • R2 ajustado
  • Prueba de Durbin-Watson
  • valor P
  • Error estándar residual
  • Índice estadístico F

Puede utilizar las salidas y estadísticas para analizar la precisión del modelo.

Después de crear el modelo, se agrega al panel de datos un nuevo dataset de función. Es posible utilizar el dataset de función en la funcionalidad Predecir variable. Crear modelo de regresión también crea un dataset de resultados, que incluye todos los campos de la entrada, más los campos estimated, residual y standardized_residual. Los campos contienen la siguiente información:

  • estimated: el valor de la variable dependiente estimado por el modelo de regresión
  • residual: la diferencia entre el valor de campo original y el valor estimado de la variable dependiente
  • standardized_residual: la ratio del residual y la desviación estándar del residual

Cómo funciona Crear modelo de regresión

Se puede crear un modelo de regresión OLS si se cumplen los siguientes supuestos:

  • El modelo debe ser lineal en sus parámetros.
  • Los datos son una muestra aleatoria de la población.
  • Las variables independientes no son ampliamente colineales.
  • Las variables independientes se miden precisamente para que el error de medición sea poco significativo.
  • El valor previsto de los residuales siempre es cero.
  • Los residuales tienen varianza constante (varianza homogénea).
  • Los residuales están distribuidos de forma normal.

Crear modelo de regresión a menudo se ejecuta correctamente incluso aunque no se cumplan una o más suposiciones. Las suposiciones de OLS se deben probar antes de utilizar Crear modelo de regresión. Si no se cumplen las suposiciones, puede que el modelo no sea válido.

No es posible crear un modelo si no se cumple la tercera suposición (las variables independientes no son ampliamenter colineales). En ese caso, aparece Hay dos o más variables explicativas relacionadas. Elimine una de las variables colineales e inténtelo de nuevo. aparece el mensaje. Es posible determinar las variables que son colineales mediante un gráfico de dispersión o una matriz de gráficos de dispersión. Las variables colineales tendrán una relación lineal y una de las variables dependerá más de la otra. Elimine la variable colineal dependiente del modelo.

Para obtener más información sobre las suposiciones de los modelos de OLS, consulte Análisis de regresión.