Crear modelo de regresión

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Crear modelo de regresión se utiliza para modelar la relación entre dos o más variables explicativas y una variable de respuesta encajando una ecuación lineal a los datos observados. Cada valor de la variable independiente (x) está asociado a un valor de la variable dependiente (y).

Crear modelo de regresión utiliza Mínimos cuadrados ordinarios (OLS) como el tipo de regresión.

Ejemplo

Una organización medioambiental está estudiando la causa de las emisiones de gases efecto invernadero por países, de 1990 a 2015. La funcionalidad Crear modelo de regresión se puede usar para crear una ecuación capaz de estimar la cantidad de emisiones de gases de efecto invernadero por países en función de variables explicativas tales como población y producto interior bruto (PIB).

Usar la funcionalidad Crear modelo de regresión

Siga estos pasos para ejecutar la funcionalidad de análisis Crear modelo de regresión:

  1. Cree un mapa, gráfico o tabla con el dataset con el que desee crear un modelo de regresión.
  2. Haga clic en el botón AcciónAcción.
  3. Realice una de las siguientes acciones:
    • Si su tarjeta es un gráfico o una tabla, haga clic en ¿Cómo está relacionado? en el panel Análisis.
    • Si su tarjeta es un mapa, haga clic en la pestaña Buscar respuestas y, luego, en ¿Cómo está relacionado?.
  4. Haga clic en Crear modelo de regresión.
  5. En Elegir una capa, seleccione el dataset con el que desee crear un modelo de regresión.
  6. En Elegir una variable dependiente, elija el campo que desee explicar con su modelo. El campo debe ser numérico o de índice/ratio.
  7. Haga clic en Seleccionar variables explicativas para mostrar un menú de campos disponibles.
  8. Seleccione los campos que desee usar como variables explicativas (también llamadas variables independientes).
  9. Haga clic en Seleccionar para aplicar las variables explicativas.
  10. Haga clic en el botón Visualizar para ver un gráfico de dispersión o una matriz de gráficos de dispersión de las variables dependientes y explicativas, si las hay. Los gráficos de dispersión se pueden utilizar como parte del análisis exploratorio de su modelo.
    Nota:

    El botón Visualizar no está disponible si se seleccionan cinco o más variables explicativas.

  11. Haga clic en Ejecutar.

Se crea el modelo de regresión de las variables dependientes y explicativas seleccionadas. Ahora puede utilizar las salidas y estadísticas para seguir verificando la validez del modelo con análisis exploratorios y confirmatorios.

Notas de uso

Encontrará Crear modelo de regresión haciendo clic en el botón Acción Acción, en ¿Cómo está relacionado? en la pestaña Buscar respuestas.

Puede elegir un campo numérico o de índice/ratio como la variable dependiente. La variable dependiente es el campo numérico que intenta explicar con su modelo de regresión. Por ejemplo, si va a crear un modelo de regresión para determinar las causas de la mortalidad infantil, el índice de mortalidad infantil es la variable dependiente.

Puede elegir hasta 20 campos numéricos o de índice/ratio como variables explicativas. Las variables explicativas son variables independientes que se pueden elegir como parte del modelo de regresión para explicar la variable dependiente. Por ejemplo, si va a crear un modelo de regresión para determinar las causas de la mortalidad infantil, las variables explicativas pueden incluir índices de pobreza, índices de enfermedades e índices de vacunación. Si el número de variables explicativas elegido es cuatro o menos, puede crear un gráfico de dispersión o una matriz de gráficos de dispersión haciendo clic en Visualizar.

Estadísticas del modelo ofrece los siguientes valores de salida:

  • Ecuación de regresión
  • R2
  • R2 ajustado
  • Prueba de Durbin-Watson
  • valor P
  • Error estándar residual
  • Índice estadístico F

Puede utilizar las salidas y estadísticas para analizar la precisión del modelo.

Después de crear el modelo, se agrega al panel de datos un nuevo dataset de función. Es posible utilizar el dataset de función en la funcionalidad Predecir variable. Crear modelo de regresión también crea un dataset de resultados, que incluye todos los campos de la entrada, más los campos estimated, residual y standardized_residual. Los campos contienen la siguiente información:

  • estimated: el valor de la variable dependiente estimado por el modelo de regresión
  • residual: la diferencia entre el valor de campo original y el valor estimado de la variable dependiente
  • standardized_residual: la ratio del residual y la desviación estándar del residual

Cómo funciona Crear modelo de regresión

Es posible crear un modelo Mínimos cuadrados ordinarios si se cumplen las siguientes suposiciones:

  • El modelo debe ser lineal en sus parámetros.
  • Los datos son una muestra aleatoria de la población.
  • Las variables independientes no son demasiado colineales.
  • Las variables independientes se miden precisamente para que el error de medición sea poco significativo.
  • El valor previsto de los residuales siempre es cero.
  • Los residuales tienen varianza constante (varianza homogénea).
  • Los residuales están distribuidos de forma normal.

Crear modelo de regresión a menudo se ejecuta correctamente incluso aunque no se cumplan una o más suposiciones. Por tanto, las suposiciones de OLS se deben probar antes de utilizar Crear modelo de regresión. Si no se cumplen las suposiciones, puede que el modelo no sea válido.

No es posible crear un modelo si no se cumple la tercera suposición (las variables independientes no son demasiado colineales). En ese caso, aparece el mensaje Hay dos o más variables explicativas relacionadas. Elimine una de las variables colineales e inténtelo de nuevo. Es posible determinar las variables que son colineales mediante un gráfico de dispersión o una matriz de gráficos de dispersión. Las variables colineales tendrán una relación lineal y una de las variables dependerá más de la otra. Elimine la variable colineal dependiente del modelo.

Para obtener más información sobre las suposiciones de los modelos de OLS, consulte Análisis de regresión.