Datasets de función

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Los datasets de función se crean como salida de Crear modelo de regresión. Un dataset de función contiene la ecuación y las estadísticas de un modelo de regresión.

Usar un dataset de función

Los datasets de función se utilizan como modelo de regresión de entrada para Predecir variable. Puede abrir Predecir variable arrastrando un dataset de función a una tarjeta de mapa.

Se puede crear un gráfico de puntos que muestre los coeficientes e intervalos de confianza de la interceptación y de cada variable explicativa expandiendo un dataset de función en el panel de datos y haciendo clic en Ver intervalos de confianza.

Sugerencia:

Drag-N Drop Arrastre un dataset de función al gráfico de puntos creado a partir de otro modelo de regresión para comparar los intervalos de confianza de las variables explicativas entre modelos.

Estadísticas

Los datasets de función almacenan la ecuación y las estadísticas de un modelo de regresión. Puede visualizar las estadísticas expandiendo el dataset de función en el panel de datos o abriendo la tabla de datos.

En el panel de datos están disponibles las siguientes estadísticas:

EstadísticaDescripción

Ecuación de regresión

La ecuación de regresión tiene el siguiente formato:

y=b0+b1x1+b2x2+...+bnxn

y es la variable dependiente; bn representa los parámetros calculados; y xn representa las variables explicativas.

R2

El valor R2, también conocido como el coeficiente de determinación, es un número entre 0 y 1 que mide el grado en que la línea de mejor ajuste modela los puntos de datos, donde los valores más cercanos al 1 indican modelos más precisos.

R2 ajustado

R2 ajustado también es una medición entre 0 y 1, pero tiene en cuenta más indicadores que pueden generar un mejor ajuste en un modelo basado solo en el azar. Por tanto, se recomienda el uso de valor R2 ajustado si el modelo tiene más indicadores, o si se comparan modelos con distinto número de indicadores.

Durbin-Watson

La prueba Durbin-Watson mide la autocorrelación en los residuales de un análisis de regresión en una escala del 0 al 4. En esta escala, de 0 a 2 es una autocorrelación positiva, 2 es nada de autocorrelación y de 2 a 4 es una autocorrelación negativa. Se recomienda tener una autocorrelación baja en un modelo de regresión, de modo que son más favorables los valores de la prueba de Durbin-Watson que sean más cercanos a 2.

Nota:

El cálculo de la prueba de Durbin-Watson depende del orden de sus datos. Es importante que sus datos estén ordenados de forma secuencial, especialmente si los datos están relacionados con el tiempo. Si sus datos no están ordenados debidamente, es posible que el valor de la prueba de Durbin-Watson no sea preciso.

Error estándar residual

El error estándar residual mide la precisión con la que el modelo de regresión puede predecir valores con nuevos datos. Cuanto más bajo es el valor, más preciso es el modelo. El valor de los grados de libertad residuales también se indica con el error estándar residual.

Índice estadístico F

El índice estadístico F se utiliza para determinar la funcionalidad predictiva de su modelo de regresión determinando si los coeficientes son significativamente diferentes a 0. El índice estadístico F se indica como un valor igual o mayor que 0 e incluye dos valores de grados de libertad, el primero de los cuales representa los grados de libertad de las variables explicativas y el segundo, los grados de libertad de los residuales.

valor P

El valor P del índice estadístico F es una prueba de importancia global para su modelo de regresión. Un valor P se indica como un valor entre 0,0 y 1,0. Los valores comprendidos entre 0 y 0,05 indican que su modelo global es estadísticamente significativo.

En la tabla de datos están disponibles las siguientes estadísticas:

EstadísticaDescripción

Variable

La interceptación y los nombres de las variables explicativas.

Coeficiente

Los valores B de la ecuación de regresión, que se corresponden con la interceptación y la pendiente de cada variable explicativa.

Error estándar

El error estándar mide la variación en cada uno de los indicadores utilizados en el modelo. Cuanto más bajo es el valor, más precisos son los indicadores.

valor T

El valor T se utiliza para determinar la funcionalidad predictiva de cada coeficiente de regresión determinando si los coeficientes son significativamente diferentes a 0.

valor P

El valor P está relacionado con el valor T y prueba la importancia local de los coeficientes de su modelo de regresión. Un valor P se indica como un valor entre 0,0 y 1,0. Los valores comprendidos entre 0,0 y 0,05 indican que el coeficiente es estadísticamente significativo.

Intervalo de confianza

Los intervalos de confianza indican los límites superior e inferior dentro de los cuales se puede tener cierto grado de certeza de que el coeficiente se encuentra dentro del rango. Por ejemplo, si el intervalo de confianza del 95 por ciento inferior es 10 y el intervalo de confianza del 95 por ciento superior es 15, puede tener una confianza del 95 por ciento de que el valor real del coeficiente está entre 10 y 15.

En la tabla de datos se indican los siguientes intervalos de confianza:

  • 90 por ciento inferior
  • 90 por ciento superior
  • 95 por ciento inferior
  • 95 por ciento superior
  • 99 por ciento inferior
  • 99 por ciento superior

Coeficientes estandarizados

Los coeficientes estandarizados se calculan estandarizando los datos para que la varianza de las variables dependientes y explicativas sea igual a 1. Los coeficientes estandarizados resultan especialmente útiles para comparar valores de coeficiente con distintas unidades de medida.

Intervalos de confianza estandarizados

Los intervalos de confianza estandarizados indican los límites superior e inferior dentro de los cuales puede tener cierto grado de certeza de que el coeficiente estandarizado se encuentra dentro del rango.

En la tabla de datos se indican los siguientes intervalos de confianza estandarizados:

  • 90 % inferior
  • 90 % superior
  • 95 % inferior
  • 95 % superior
  • 99 % inferior
  • 99 % superior

Para obtener más información sobre cómo usar e interpretar los resultados estadísticos en un dataset de función, consulte Análisis de regresión.