Regresión ponderada geográficamente multiescala (MGWR) (Estadística espacial)

Resumen

Realiza una Regresión ponderada geográficamente multiescala (MGWR), que es una forma local de regresión lineal que modela las relaciones que varían espacialmente.

MGWR se basa en la regresión ponderada geográficamente (GWR). Es un modelo de regresión local que permite que los coeficientes de las variables explicativas varíen en el espacio. Cada variable explicativa puede funcionar en una escala espacial diferente. GWR no tiene en cuenta esto, pero MGWR lo hace al permitir una vecindad diferente (ancho de banda) para cada variable explicativa. La vecindad (ancho de banda) de una variable explicativa determina las entidades que se utilizan para estimar el coeficiente de esa variable explicativa en el modelo de regresión lineal que se ajusta a una entidad de destino.

Más información sobre cómo funciona Regresión ponderada geográficamente multiescala (MGWR)

Ilustración

Ilustración de la herramienta Regresión ponderada geográficamente multiescala
Se aplica un kernel bicuadrado a la vecindad de cada variable explicativa. Cada variable explicativa utiliza un ancho de banda diferente para capturar distintas relaciones espaciales.

Uso

  • Esta herramienta resulta más efectiva para los datasets con al menos varios cientos de entidades. No es una herramienta adecuada para datasets pequeños. La herramienta no funciona con datos de multipunto.

  • Use el parámetro Entidades de entrada con un campo que represente el fenómeno que está modelando (el valor Variable dependiente) y uno o varios campos que representen el valor de Variables explicativas. Estos campos deben ser numéricos e incluir un rango de valores. Las entidades que contienen valores que faltan en la variable explicativa o dependiente se excluirán del análisis; sin embargo, puede usar la herramienta Rellenar valores que faltan para completar el dataset antes de ejecutar la herramienta Regresión ponderada geográficamente multiescala.

  • El modelo actual solo acepta variables dependientes que representan valores continuos. No utilice la herramienta con variables dependientes de recuento, tasa o binaria (indicador). Actualmente, la opción Continuo del parámetro Tipo de modelo es la única admitida. En versiones futuras se pueden agregar otras opciones.

    Si se proporciona una variable dependiente no continua, los resultados pueden carecer de significado, por ejemplo, las predicciones con recuentos negativos o probabilidades mayores que uno.

    Precaución:

    Las variables explicativas (no variable dependiente) pueden ser de cualquier tipo, pero tenga cuidado al utilizar variables explicativas de recuento, tasa o binarias. Los modelos de regresión local que utilizan variables explicativas no continuas suelen experimentar problemas de multicolinealidad local. Si alguna variable explicativa está altamente correlacionada, ya sea global o localmente, la herramienta puede fallar con el error 110222 debido a la multicolinealidad.

    Más información sobre la multicolinealidad

  • Debe haber variación global y local en los campos de los parámetros Variable dependiente y Variables explicativas. No utilice campos que contengan un solo valor constante, variables explicativas de indicador que representen distintos regímenes espaciales ni variables de categorías agrupadas espacialmente.

  • Para utilizar variables explicativas de categorías, las categorías se deben convertir en variables de indicador (0 o 1) utilizando la herramienta Codificar campo. A continuación, puede utilizar estas variables de indicador como variables explicativas en la herramienta Regresión ponderada geográficamente multiescala.

  • Esta herramienta genera una clase de entidad y agrega campos con los valores de diagnóstico locales. Los valores de Entidades de salida y gráficos asociados se agregan automáticamente a la tabla de contenido con un esquema de color divergente que se aplica a los residuales del modelo.

  • Existen cuatro opciones para el parámetro Método de selección de vecindad que se pueden utilizar para estimar la escala espacial óptima para cada una de las variables explicativas:

    • Búsqueda dorada: determina el número de vecinos o la banda de distancia para cada variable explicativa utilizando el algoritmo Búsqueda dorada. Este método busca varias combinaciones de valores para cada variable explicativa entre un valor mínimo y un valor máximo especificados. El procedimiento es iterativo y utiliza los resultados de los valores anteriores para seleccionar cada nueva combinación que se va a probar. Los valores finales seleccionados tendrán el AICc más pequeño. Para la opción de número de vecinos, los valores mínimo y máximo se especifican utilizando los parámetros Cantidad mínima de vecinos y Cantidad máxima de vecinos. Para la opción de banda de distancia, los valores mínimo y máximo se especifican utilizando los parámetros Distancia mínima de búsqueda y Distancia máxima de búsqueda. Los valores mínimo y máximo se comparten para todas las variables explicativas, pero el número estimado de vecinos o bandas de distancia será diferente para cada variable explicativa (a menos que dos o más casualmente tengan la misma escala espacial). Esta opción es la que tarda más tiempo en calcularse, especialmente para datasets grandes o de alta dimensión.

    • Búsqueda en gradiente: determina el número de vecinos o bandas de distancia para cada variable explicativa mediante un algoritmo de optimización basado en gradiente. Para hallar el ancho de banda óptimo de cada variable explicativa, Búsqueda en gradiente toma la derivada del AICc con respecto a los anchos de banda y actualiza los anchos de banda hasta que encuentra el AICc más bajo. Para la opción de número de vecinos, los valores mínimo y máximo se especifican utilizando los parámetros Cantidad mínima de vecinos y Cantidad máxima de vecinos. Para la opción Banda de distancia, los valores mínimo y máximo se especifican utilizando los parámetros Distancia mínima de búsqueda y Distancia máxima de búsqueda. Al igual que Búsqueda dorada, los valores mínimo y máximo se comparten para todas las variables explicativas, pero el número estimado de vecinos o la banda de distancia podría ser diferente para cada variable explicativa (a menos que dos o más casualmente tengan la misma escala espacial). Esta opción estima vecindades comparables con respecto a Búsqueda dorada, pero tiene un mejor rendimiento de tiempo de ejecución y requiere un uso significativamente menor de la memoria.

    • Intervalos manuales: determina la cantidad de vecinos o bandas de distancia para cada variable explicativa incrementando el número de vecinos o bandas de distancia a partir de un valor mínimo. Para la opción de cantidad de vecinos, el método comienza con el valor del parámetro Cantidad mínima de vecinos. A continuación, la cantidad de vecinos aumenta según el valor del parámetro Incremento de número de vecinos. Este incremento se repite un determinado número de veces, especificado con el parámetro Número de incrementos. Para la opción de banda de distancia, el método utiliza los parámetros Distancia mínima de búsqueda, Incremento de distancia de búsqueda y Número de incrementos. El número de vecinos o bandas de distancia utilizado por cada variable explicativa será uno de los valores probados, pero los valores pueden ser diferentes para cada variable explicativa. Esta opción es más rápida que Búsqueda dorada y con frecuencia estima vecindades comparables.

    • Definido por el usuario: el número de vecinos o bandas de distancia que utilizan todas las variables explicativas. El valor se especifica mediante el parámetro Cantidad de vecinos o Banda de distancia. Esta opción proporciona el máximo control si conoce los valores óptimos.

    De forma predeterminada, los parámetros de vecindad dependiente de cada método de selección de vecindad se aplican a todas las variables explicativas. Sin embargo, solo es posible proporcionar unos parámetros de selección de vecindad personalizados para determinadas variables explicativas utilizando el correspondiente parámetro de invalidación para el tipo de vecindad y el método de selección: Cantidad de vecinos para Búsqueda dorada, Cantidad de vecinos para Búsqueda en gradiente, Cantidad de vecinos para Intervalos manuales, Cantidad de vecinos definida por el usuario, Distancia de búsqueda para Búsqueda dorada, Distancia de búsqueda para Búsqueda en gradiente, Distancia de búsqueda para Intervalos manuales o Distancia de búsqueda definida por el usuario. Para utilizar vecindades personalizadas para determinadas variables explicativas, proporcione las variables explicativas en la primera columna del correspondiente parámetro de invalidación correspondiente y proporcione las opciones personalizadas de la vecindad en las otras columnas. Las columnas tienen los mismos nombres que los parámetros que invalidan; por ejemplo, si utiliza intervalos manuales con banda de distancia, la columna Incremento de distancia de búsqueda especifica valores personalizados del parámetro Incremento de distancia de búsqueda. En el panel Geoprocesamiento, los parámetros de vecindad personalizada se encuentran en la categoría del parámetro Opciones de vecindad personalizada.

    Por ejemplo, supongamos que utiliza tres variables explicativas con el tipo de vecindad Búsqueda dorada con mínimo de 30 vecinos y máximo de 40 vecinos. Si la herramienta se ejecuta con estos parámetros, cada una de las tres variables explicativas utilizará entre 30 y 40 vecinos. Si, en cambio, desea utilizar entre 45 y 55 vecinos solo para la segunda variable explicativa, puede proporcionar la segunda variable explicativa, el mínimo personalizado y el máximo personalizado en las columnas del parámetro Cantidad de vecinos para Búsqueda dorada. Con estos parámetros, la primera y la tercera variables explicativas utilizarán entre 30 y 40 vecinos, y la segunda variable explicativa utilizará entre 45 y 55 vecinos.

  • Se muestran varios diagnósticos de modelo en los mensajes de geoprocesamiento que se pueden utilizar para evaluar la fiabilidad del modelo MGWR. Revise estos diagnósticos antes de visualizar cualquier otra salida de herramienta. Si el diagnóstico del modelo es aceptable, visualice los gráficos y la simbología de las entidades de salida para comprender mejor los resultados.

    Más información sobre el diagnóstico de modelo y las salidas de la herramienta

  • Evalúe los resultados y considere si la relación entre cada variable explicativa y la variable dependiente es lineal, si falta alguna variable explicativa (especificación incorrecta) o si alguna es redundante (multicolinealidad), si hay valores atípicos o si los residuales no se distribuyen normalmente. Para obtener más información sobre los posibles problemas del modelo de regresión, consulte Conceptos básicos del análisis de regresión.

  • Para obtener los resultados más precisos, proyecte los datos en un sistema de coordenadas proyectadas si las coordenadas están almacenadas como latitud y longitud. Es especialmente importante cuando se utiliza la opción Banda de distancia del parámetro Tipo de vecindad, ya que las optimizaciones requieren medidas de distancia precisas.

  • Si activa el parámetro Datos de escala, se creará una capa para cada coeficiente escalado. Los coeficientes que se re-escalan a las unidades de datos originales se almacenan como campos en la clase de entidad de salida. Si se crean rásteres de coeficiente con el parámetro Espacio de trabajo de ráster de coeficiente, se crearán capas de los rásteres de coeficiente escalado y los rásteres reescalados se guardarán en el espacio de trabajo.

    Se recomienda escalar las variables explicativas y dependientes. Es especialmente importante cuando el rango de valores de las variables varía considerablemente porque el escalado iguala las varianzas de los valores de las variables explicativas. Al estimar numéricamente el ancho de banda y los coeficientes de cada modelo local, las estimaciones por lo general convergen más rápido y para valores más precisos cuando cada variable aporta cantidades iguales a la varianza total de los datos. Si las variables explicativas presentan varianzas diferentes, las variables con varianzas más grandes tendrán una influencia mayor en cada paso de la estimación iterativa. En la mayoría de los casos, esta influencia afectará negativamente a los anchos de banda y coeficientes finales del modelo.

  • En algunos casos, la opción Intervalo manual del parámetro Método de selección de vecindad puede estimar un valor de AICc más bajo que la opción Búsqueda dorada incluso cuando se busca en el mismo rango de distancias o vecinos. Del mismo modo, si realiza Búsqueda dorada o intervalos manuales y, a continuación, proporciona los anchos de banda o la cantidad de vecinos estimados con la opción Definido por el usuario, las salidas no serán exactamente las mismas. Ambos comportamientos se deben a las dependencias de ruta de los algoritmos de Búsqueda dorada y ajuste de fondo que se utilizan para estimar los parámetros de modelo MGWR. Para reproducir los mismos resultados de MGWR, debe ejecutar la herramienta con la misma configuración de parámetros.

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

La clase de entidad que contiene las variables dependientes y explicativas.

Feature Layer
Variable dependiente

El campo numérico que contiene los valores observados que se van a modelar.

Field
Tipo de modelo

Especifica el modelo de regresión basándose en los valores de la variable dependiente. Actualmente, solo se admiten datos continuos y el parámetro está oculto en el panel Geoprocesamiento. No utilice variables dependientes de categorías, de recuento ni binarias.

  • ContinuoLa variable dependiente representa valores continuos. Esta es la opción predeterminada.
String
Variables explicativas

Una lista de campos que se utilizarán como variables explicativas independientes en el modelo de regresión.

Field
Entidades de salida

La nueva clase de entidad que contiene los coeficientes, residuales y niveles de significancia del modelo MGWR. La clase de entidad se agregará al panel Contenido en una capa de grupo.

Feature Class
Tipo de vecindad

Especifica si la vecindad utilizada será una distancia fija o si puede variar espacialmente en función de la densidad de las entidades.

  • Cantidad de vecinosEl tamaño de la vecindad será una cantidad especificada de vecinos más cercanos para cada entidad. Si las entidades son densas, la extensión espacial de la vecindad será más pequeña; si las entidades están dispersas, la extensión espacial de la vecindad será más grande.
  • Banda de distanciaEl tamaño de vecindad será una distancia fija o constante para cada entidad.
String
Método de selección de vecindad

Especifica cómo se determina el tamaño de la vecindad.

  • Búsqueda doradaSe identificarán una distancia o cantidad de vecinos óptimas minimizando el valor de AICc mediante el algoritmo Búsqueda dorada. Esta opción es la que tarda más tiempo en calcularse, especialmente para datasets grandes o de alta dimensión.
  • Búsqueda en gradienteSe identificará una distancia o un número de vecinos óptimos minimizando el valor de AICc mediante el algoritmo de optimización basado en gradiente. Esta opción es la más rápida y requiere un uso de la memoria significativamente menor que la Búsqueda dorada.
  • Intervalos manualesSe identificarán una distancia o un número de vecinos probando un rango de valores y determinando el valor con el AICc más pequeño. Si el parámetro Tipo de vecindad se establece en Banda de distancia, el valor mínimo de este rango lo proporciona el parámetro Distancia mínima de búsqueda. A continuación, el valor mínimo se incrementa según el valor especificado en el parámetro Incremento de distancia de búsqueda. Esto se repite el número de veces especificado por el parámetro Número de incrementos. Si el parámetro Tipo de vecindad se ha definido como Número de incrementos, los incrementos de valor mínimo, tamaño de incremento y número de incrementos los proporcionan los parámetros Cantidad mínima de vecinos, Cantidad de incrementos de vecinos y Número de incrementos, respectivamente.
  • Definido por el usuarioEl tamaño de la vecindad se especificará por el valor del parámetro Cantidad de vecinos o el valor del parámetro Banda de distancia.
String
Cantidad mínima de vecinos
(Opcional)

El número mínimo de vecinos que cada entidad incluirá en su cálculo. Se recomienda usar al menos 30 vecinos.

Long
Cantidad máxima de vecinos
(Opcional)

El número máximo de vecinos que cada entidad incluirá en sus cálculos.

Long
Unidad de distancia
(Opcional)

Especifica la unidad de distancia que se utilizará para medir las distancias entre las entidades.

  • Pies internacionalesLas distancias se medirán en pies internacionales.
  • Millas terrestresLas distancias se medirán en millas terrestres.
  • Pies de agrimensura de EE. UU.Las distancias se medirán en pies de agrimensura de EE. UU.
  • MetrosLas distancias se medirán en metros.
  • KilómetrosLas distancias se medirán en kilómetros.
  • Millas de agrimensura de EE. UU.Las distancias se medirán en millas de agrimensura de EE. UU.
String
Distancia mínima de búsqueda
(Opcional)

La distancia de búsqueda mínima que se aplicará a cada variable explicativa. Se recomienda que proporcione una distancia mínima que incluya al menos 30 vecinos para cada entidad.

Double
Distancia máxima de búsqueda
(Opcional)

La distancia máxima de búsqueda en la vecindad que se aplicará a todas las variables.

Double
Incremento de número de vecinos
(Opcional)

El número de vecinos en los que se aumentarán los intervalos manuales en cada evaluación de vecindad.

Long
Incremento de distancia de búsqueda
(Opcional)

La distancia en la que aumentarán los intervalos manuales en cada evaluación de vecindad.

Double
Número de incrementos
(Opcional)

El número de tamaños de vecindad que se evaluarán al utilizar intervalos manuales. El primer tamaño de vecindad es el valor del parámetro Cantidad mínima de vecinos o Distancia mínima de búsqueda.

Long
Cantidad de vecinos
(Opcional)

La cantidad de vecinos que se utilizará para el tipo de vecindad definido por el usuario.

Long
Banda de distancia
(Opcional)

El tamaño de la banda de distancia que se utilizará para el tipo de vecindad definido por el usuario. Todas las entidades dentro de esta distancia se incluirán como vecinas en los modelos locales.

Double
Cantidad de vecinos para Búsqueda dorada
(Opcional)

Las opciones personalizadas de Búsqueda dorada para variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la cantidad mínima de vecinos y la cantidad máxima de vecinos en las columnas.

Value Table
Cantidad de vecinos para Intervalos manuales
(Opcional)

Las opciones de intervalos manuales personalizados para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la cantidad mínima de vecinos, el número de incrementos de vecinos y el número de incrementos en las columnas.

Value Table
Cantidad de vecinos definida por el usuario
(Opcional)

Las opciones personalizadas definidas por el usuario para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la cantidad de vecinos.

Value Table
Distancia de búsqueda para Búsqueda dorada
(Opcional)

Las opciones personalizadas de Búsqueda dorada para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la distancia mínima de búsqueda y la distancia máxima de búsqueda en las columnas.

Value Table
Distancia de búsqueda para Intervalos manuales
(Opcional)

Las opciones de intervalos manuales personalizados para las variables explicativas individuales. Para cada variable que se va a personalizar, proporcione la variable, la distancia mínima de búsqueda, incrementos de distancia de búsqueda y el número de incrementos en las columnas.

Value Table
Distancia de búsqueda definida por el usuario
(Opcional)

Las opciones personalizadas definidas por el usuario para las variables explicativas individuales. Para cada variable que se va a personalizar, proporcione la variable y la banda de distancia en las columnas.

Value Table
Ubicaciones de predicción
(Opcional)

Una clase de entidad con las ubicaciones donde se realizarán los cálculos. Cada entidad en este dataset debe incluir un valor para cada variable explicativa especificada. La variable dependiente para estas entidades se calculará con el modelo calibrado para los datos de la clase de entidad de entrada. Las ubicaciones de estas entidades deben estar cerca de (dentro del 115 por ciento de la extensión) o estar dentro de la misma área de estudio que las entidades de entrada.

Feature Layer
Variables explicativas para combinar
(Opcional)

Las variables explicativas de las ubicaciones de predicción que coinciden con las variables explicativas correspondientes de las entidades de entrada.

Value Table
Entidades predichas de salida
(Opcional)

La clase de entidad de salida que recibirá estimaciones de variables dependientes para cada ubicación de predicción.

Feature Class
Predicción firme
(Opcional)

Especifica las entidades que se usarán en los cálculos de predicciones.

  • Activado: las entidades con valores que superen tres desviaciones estándar respecto del valor medio (valores atípicos de valores) y entidades con ponderaciones de 0 (valores atípicos espaciales) se excluirán de los cálculos de predicciones, pero recibirán predicciones en la clase de entidad de salida. Esta es la opción predeterminada.
  • Desactivado: todas las entidades se usarán en los cálculos de predicciones.

Boolean
Esquema de ponderación local
(Opcional)

Especifica el tipo kernel que se usará para proporcionar la ponderación espacial en el modelo. El kernel define cómo las entidades están relacionadas entre sí dentro de su vecindad.

  • BicuadradoSe asigna una ponderación de cero a todas las entidades que se encuentren fuera de la vecindad especificada. Esta es la opción predeterminada.
  • GaussianoTodas las entidades recibirán ponderaciones, que serán exponencialmente más pequeñas cuanto más se alejen de la entidad de destino.
String
Tabla de vecindad de salida
(Opcional)

Una tabla que contiene las estadísticas de salida del modelo MGWR. La salida incluirá un gráfico de barras de anchos de banda o números de vecinos estimados.

Table
Espacio de trabajo de ráster de coeficiente
(Opcional)

El espacio de trabajo donde se crearán los rásteres de coeficiente. Cuando se proporciona este espacio de trabajo, se crean rásteres para la intercepción y para cada variable explicativa. Este parámetro solo está disponible con una licencia Desktop Advanced. Si se proporciona un directorio, los rásteres serán de tipo ráster TIFF (.tif).

Workspace
Escalar datos
(Opcional)

Especifica si los valores de las variables explicativas y dependientes se estandarizarán (también denominado estandarización de puntuación z) para que tengan un valor medio de cero y una desviación estándar de uno antes de ajustar el modelo.

  • Activado: los valores de las variables se escalarán. Los resultados contendrán versiones escaladas y sin escalar de los coeficientes de la variable explicativa.
  • Desactivado: los valores de las variables no se escalarán. Todos los coeficientes estarán sin escalar y se mostrarán en las unidades de datos originales.

Boolean
Cantidad de vecinos para Búsqueda en gradiente
(Opcional)

Las opciones personalizadas de Búsqueda en gradiente para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la cantidad mínima de vecinos y la cantidad máxima de vecinos en las columnas.

Value Table
Distancia de búsqueda para Búsqueda en gradiente
(Opcional)

Las opciones personalizadas de Búsqueda en gradiente para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la distancia mínima de búsqueda y la distancia máxima de búsqueda en las columnas.

Value Table

Salida derivada

EtiquetaExplicaciónTipo de datos
Capas ráster de coeficiente

Los rásteres de salida de coeficientes de variable explicativa.

Raster
Grupo de capas de salida

Una capa de grupo de las salidas. El nombre de la capa de grupo es el valor del parámetro Entidades de salida con _MGWR_Results incorporado al final. Contiene el residual estandarizado y una capa de subgrupo separada para cada variable explicativa. Cada capa de subgrupo incluye una capa de Coeficiente y una capa de Significancia. La capa de grupo se agregará al panel Contenido.

Group Layer

arcpy.stats.MGWR(in_features, dependent_variable, model_type, explanatory_variables, output_features, neighborhood_type, neighborhood_selection_method, {minimum_number_of_neighbors}, {maximum_number_of_neighbors}, {distance_unit}, {minimum_search_distance}, {maximum_search_distance}, {number_of_neighbors_increment}, {search_distance_increment}, {number_of_increments}, {number_of_neighbors}, {distance_band}, {number_of_neighbors_golden}, {number_of_neighbors_manual}, {number_of_neighbors_defined}, {distance_golden}, {distance_manual}, {distance_defined}, {prediction_locations}, {explanatory_variables_to_match}, {output_predicted_features}, {robust_prediction}, {local_weighting_scheme}, {output_table}, {coefficient_raster_workspace}, {scale}, {number_of_neighbors_gradient}, {distance_gradient})
NombreExplicaciónTipo de datos
in_features

La clase de entidad que contiene las variables dependientes y explicativas.

Feature Layer
dependent_variable

El campo numérico que contiene los valores observados que se van a modelar.

Field
model_type

Especifica el modelo de regresión basándose en los valores de la variable dependiente. Actualmente, solo se admiten datos continuos y el parámetro está oculto en el panel Geoprocesamiento. No utilice variables dependientes de categorías, de recuento ni binarias.

  • CONTINUOUSLa variable dependiente representa valores continuos. Esta es la opción predeterminada.
String
explanatory_variables
[explanatory_variables,...]

Una lista de campos que se utilizarán como variables explicativas independientes en el modelo de regresión.

Field
output_features

La nueva clase de entidad que contiene los coeficientes, residuales y niveles de significancia del modelo MGWR.

Feature Class
neighborhood_type

Especifica si la vecindad utilizada será una distancia fija o si puede variar espacialmente en función de la densidad de las entidades.

  • NUMBER_OF_NEIGHBORSEl tamaño de la vecindad será una cantidad especificada de vecinos más cercanos para cada entidad. Si las entidades son densas, la extensión espacial de la vecindad será más pequeña; si las entidades están dispersas, la extensión espacial de la vecindad será más grande.
  • DISTANCE_BANDEl tamaño de vecindad será una distancia fija o constante para cada entidad.
String
neighborhood_selection_method

Especifica cómo se determina el tamaño de la vecindad.

  • GOLDEN_SEARCHSe identificarán una distancia o cantidad de vecinos óptimas minimizando el valor de AICc mediante el algoritmo Búsqueda dorada. Esta opción es la que tarda más tiempo en calcularse, especialmente para datasets grandes o de alta dimensión.
  • GRADIENT_SEARCHSe identificará una distancia o un número de vecinos óptimos minimizando el valor de AICc mediante el algoritmo de optimización basado en gradiente. Esta opción es la más rápida y requiere un uso de la memoria significativamente menor que la Búsqueda dorada.
  • MANUAL_INTERVALSSe identificarán una distancia o un número de vecinos probando un rango de valores y determinando el valor con el AICc más pequeño. Si el parámetro neighborhood_type se establece en DISTANCE_BAND, el valor mínimo de este rango lo proporciona el parámetro minimum_search_distance. A continuación, el valor mínimo se incrementa según el valor especificado en el parámetro search_distance_increment. Esto se repite el número de veces especificado por el parámetro number_of_increments. Si el parámetro neighborhood_type se ha definido como NUMBER_OF_NEIGHBORS, el valor mínimo, el tamaño de incremento y el número de incrementos los proporcionan los parámetros minimum_number_of_neighbors, number_of_neighbors_increment y number_of_increments, respectivamente.
  • USER_DEFINEDEl tamaño de la vecindad se especificará mediante el valor del parámetro number_of_neighbors o el valor del parámetro distance_band.
String
minimum_number_of_neighbors
(Opcional)

El número mínimo de vecinos que cada entidad incluirá en su cálculo. Se recomienda usar al menos 30 vecinos.

Long
maximum_number_of_neighbors
(Opcional)

El número máximo de vecinos que cada entidad incluirá en sus cálculos.

Long
distance_unit
(Opcional)

Especifica la unidad de distancia que se utilizará para medir las distancias entre las entidades.

  • FEETINTLas distancias se medirán en pies internacionales.
  • MILESINTLas distancias se medirán en millas terrestres.
  • FEETLas distancias se medirán en pies de agrimensura de EE. UU.
  • METERSLas distancias se medirán en metros.
  • KILOMETERSLas distancias se medirán en kilómetros.
  • MILESLas distancias se medirán en millas de agrimensura de EE. UU.
String
minimum_search_distance
(Opcional)

La distancia de búsqueda mínima que se aplicará a cada variable explicativa. Se recomienda que proporcione una distancia mínima que incluya al menos 30 vecinos para cada entidad.

Double
maximum_search_distance
(Opcional)

La distancia máxima de búsqueda en la vecindad que se aplicará a todas las variables.

Double
number_of_neighbors_increment
(Opcional)

El número de vecinos en los que se aumentarán los intervalos manuales en cada evaluación de vecindad.

Long
search_distance_increment
(Opcional)

La distancia en la que aumentarán los intervalos manuales en cada evaluación de vecindad.

Double
number_of_increments
(Opcional)

El número de tamaños de vecindad que se evaluarán al utilizar intervalos manuales. El primer tamaño de vecindad es el valor del parámetro minimum_number_of_neighbors o minimum_search_distance.

Long
number_of_neighbors
(Opcional)

La cantidad de vecinos que se utilizará para el tipo de vecindad definido por el usuario.

Long
distance_band
(Opcional)

El tamaño de la banda de distancia que se utilizará para el tipo de vecindad definido por el usuario. Todas las entidades dentro de esta distancia se incluirán como vecinas en los modelos locales.

Double
number_of_neighbors_golden
[number_of_neighbors_golden,...]
(Opcional)

Las opciones personalizadas de Búsqueda dorada para variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la cantidad mínima de vecinos y la cantidad máxima de vecinos en las columnas.

Value Table
number_of_neighbors_manual
[number_of_neighbors_manual,...]
(Opcional)

Las opciones de intervalos manuales personalizados para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la cantidad mínima de vecinos, el número de incrementos de vecinos y el número de incrementos en las columnas.

Value Table
number_of_neighbors_defined
[number_of_neighbors_defined,...]
(Opcional)

Las opciones personalizadas definidas por el usuario para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la cantidad de vecinos.

Value Table
distance_golden
[distance_golden,...]
(Opcional)

Las opciones personalizadas de Búsqueda dorada para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la distancia mínima de búsqueda y la distancia máxima de búsqueda en las columnas.

Value Table
distance_manual
[distance_manual,...]
(Opcional)

Las opciones de intervalos manuales personalizados para las variables explicativas individuales. Para cada variable que se va a personalizar, proporcione la variable, la distancia mínima de búsqueda, incrementos de distancia de búsqueda y el número de incrementos en las columnas.

Value Table
distance_defined
[distance_defined,...]
(Opcional)

Las opciones personalizadas definidas por el usuario para las variables explicativas individuales. Para cada variable que se va a personalizar, proporcione la variable y la banda de distancia en las columnas.

Value Table
prediction_locations
(Opcional)

Una clase de entidad con las ubicaciones donde se realizarán los cálculos. Cada entidad en este dataset debe incluir un valor para cada variable explicativa especificada. La variable dependiente para estas entidades se calculará con el modelo calibrado para los datos de la clase de entidad de entrada. Las ubicaciones de estas entidades deben estar cerca de (dentro del 115 por ciento de la extensión) o estar dentro de la misma área de estudio que las entidades de entrada.

Feature Layer
explanatory_variables_to_match
[explanatory_variables_to_match,...]
(Opcional)

Las variables explicativas de las ubicaciones de predicción que coinciden con las variables explicativas correspondientes de las entidades de entrada.

Value Table
output_predicted_features
(Opcional)

La clase de entidad de salida que recibirá estimaciones de variables dependientes para cada ubicación de predicción.

Feature Class
robust_prediction
(Opcional)

Especifica las entidades que se usarán en los cálculos de predicciones.

  • ROBUSTLas entidades con valores que superen tres desviaciones estándar respecto del valor medio (valores atípicos de valores) y entidades con ponderaciones de 0 (valores atípicos espaciales) se excluirán de los cálculos de predicciones, pero recibirán predicciones en la clase de entidad de salida. Esta es la opción predeterminada.
  • NON_ROBUSTTodas las entidades se usarán en los cálculos de predicciones.
Boolean
local_weighting_scheme
(Opcional)

Especifica el tipo kernel que se usará para proporcionar la ponderación espacial en el modelo. El kernel define cómo las entidades están relacionadas entre sí dentro de su vecindad.

  • BISQUARESe asigna una ponderación de cero a todas las entidades que se encuentren fuera de la vecindad especificada. Esta es la opción predeterminada.
  • GAUSSIANTodas las entidades recibirán ponderaciones, que serán exponencialmente más pequeñas cuanto más se alejen de la entidad de destino.
String
output_table
(Opcional)

Una tabla que contiene las estadísticas de salida del modelo MGWR. La salida incluirá un gráfico de barras de anchos de banda o números de vecinos estimados.

Table
coefficient_raster_workspace
(Opcional)

El espacio de trabajo donde se crearán los rásteres de coeficiente. Cuando se proporciona este espacio de trabajo, se crean rásteres para la intercepción y para cada variable explicativa. Este parámetro solo está disponible con una licencia Desktop Advanced. Si se proporciona un directorio, los rásteres serán de tipo ráster TIFF (.tif).

Workspace
scale
(Opcional)

Especifica si los valores de las variables explicativas y dependientes se escalarán para tener un valor medio de cero y una desviación estándar de uno antes de ajustar el modelo.

  • SCALE_DATALos valores de las variables se escalarán. Los resultados contendrán versiones escaladas y sin escalar de los coeficientes de la variable explicativa.
  • NO_SCALE_DATALos valores de las variables no se escalarán. Todos los coeficientes estarán sin escalar y se mostrarán en las unidades de datos originales.
Boolean
number_of_neighbors_gradient
[number_of_neighbors_gradient,...]
(Opcional)

Las opciones personalizadas de Búsqueda en gradiente para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la cantidad mínima de vecinos y la cantidad máxima de vecinos en las columnas.

Value Table
distance_gradient
[distance_gradient,...]
(Opcional)

Las opciones personalizadas de Búsqueda en gradiente para las variables explicativas individuales. Para cada variable explicativa que se va a personalizar, proporcione la variable, la distancia mínima de búsqueda y la distancia máxima de búsqueda en las columnas.

Value Table

Salida derivada

NombreExplicaciónTipo de datos
coefficient_raster_layers

Los rásteres de salida de coeficientes de variable explicativa.

Raster
output_layer_group

Una capa de grupo de las salidas. El nombre de la capa de grupo es el valor del parámetro Entidades de salida con _MGWR_Results incorporado al final. Contiene el residual estandarizado y una capa de subgrupo separada para cada variable explicativa. Cada capa de subgrupo incluye una capa de Coeficiente y una capa de Significancia. La capa de grupo se agregará al panel Contenido.

Group Layer

Muestra de código

Ejemplo 1 de MGWR (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función MGWR.


import arcpy
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")
Ejemplo 2 de MGWR (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función MGWR.

# Run MGWR to predict house prices using "Number of Neighbors" and "Golden Search"
# Import modules
import arcpy

# Set the current workspace
arcpy.env.workspace = "C:/data"

# Run MGWR 
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")