Régression pondérée géographiquement multi-échelle (MGWR) (Statistiques spatiales)

Synthèse

Effectue une régression pondérée géographiquement multi-échelle (MGWR), laquelle est une forme locale de régression linéaire permettant de modéliser des relations qui varient spatialement.

MGWR s’appuie sur la régression pondérée géographiquement (GWR). Il s’agit d’un modèle de régression local qui permet aux coefficients des variables explicatives de varier dans l’espace. Chaque variable explicative peut fonctionner à une échelle spatiale différente. Ceci n’est pas possible dans la GWR, mais pris en charge dans la MGWR qui autorise un voisinage différent (bande passante) pour chaque variable explicative. Le voisinage (bande passante) d’une variable explicative détermine les entités qui seront utilisées pour estimer le coefficient de cette variable explicative dans le modèle de régression linéaire qui est adapté à une entité cible.

En savoir plus sur le fonctionnement de l’outil Régression pondérée géographiquement multi-échelle (MGWR)

Illustration

Illustation de l’outil Régression pondérée géographiquement multi-échelle (MGWR)
Un noyau bicarré est appliqué au voisinage de chaque variable explicative. Chaque variable explicative utilise une bande passante différente pour capturer les relations spatiales changeantes.

Utilisation

  • L’efficacité de l’outil est meilleure avec des jeux de données contenant au moins plusieurs centaines d’entités. L’utilisation de cet outil n’est pas adaptée aux jeux de données peu volumineux. L’outil ne fonctionne pas avec les données multi-points.

  • Utilisez le paramètre Input Features (Entités en entrée) avec un champ représentant le phénomène que vous modélisez (la valeur Dependent Variable [Variable dépendante]) et un ou plusieurs champs représentant la valeur Explanatory Variable(s) [Variable(s) explicative(s)]. Ces champs doivent être numériques et inclure une plage de valeurs. Les entités qui comportent des valeurs manquantes dans la variable dépendante ou explicative seront exclues de l’analyse. Vous pouvez toutefois utiliser l’outil Fill Missing Values (Renseigner les valeurs manquantes) pour renseigner le jeu de données avant d’exécuter l’outil Régression pondérée géographiquement multi-échelle.

  • Le modèle actuel n’accepte que des variables dépendantes représentant des valeurs continues. N’utilisez pas l’outil avec des variables dépendantes de type total, taux ou binaire (indicateur). Actuellement, l’option Continuous (Continue) du paramètre Model Type (Type de modèle) est la seule option prise en charge. D’autres options pourront être ajoutées dans des versions ultérieures.

    Si une variable dépendante non continue est fournie, les résultats pourraient manquer de pertinence, produisant par exemple des prévisions de totaux négatifs ou des probabilités supérieures à 1.

    Attention :

    Les variables explicatives (pas les variables dépendantes) peuvent être de n’importe quel type, mais soyez prudent lorsque vous utilisez des variables explicatives de type total, taux ou binaire. Les modèles de régression locaux utilisant des variables explicatives non-continues rencontrent fréquemment des problèmes de multicolinéarité locale. Si des variables explicatives sont fortement corrélées, que ce soit globalement ou localement, l’outil peut échouer avec l’erreur 110222 en raison de la multicolinéarité.

    Pour en savoir plus la multicolinéarité

  • Les champs fournis dans les paramètres Dependent Variable (Variable dépendante) et Explanatory Variables (Variables explicatives) doivent présenter une variation à la fois globale et locale. N’utilisez pas des champs contenant une seule valeur constante, des variables explicatives de type indicateur qui représentent des régimes spatiaux différents ou des variables catégorielles agrégées spatialement.

  • Pour utiliser des variables explicatives catégorielles, les catégories doivent être converties en variables de type indicateur (0 ou 1) à l’aide de l’outil Encode Field (Encoder un champ). Ces variables de type indicateur peuvent ensuite être utilisées comme variables explicatives dans l’outil Régression pondérée géographiquement multi-échelle.

  • Cet outil génère une classe d’entités et ajoute des champs comportant les valeurs de diagnostic locales. Les valeurs des Output Features (Entités en sortie) et diagrammes associés sont automatiquement ajoutés à la table des matières et un schéma de couleurs divergeant est appliqué aux résiduels du modèle.

  • Quatre options sont disponibles pour le paramètre Neighborhood Selection Method (Méthode de sélection de voisinage) pour estimer l’échelle spatiale optimale pour chacune des variables explicatives.

    • Golden Search (Recherche absolue) : détermine soit le nombre de voisins, soit la bande de distance pour chaque variable explicative à l’aide de l’algorithme de recherche absolue. Cette méthode teste plusieurs combinaisons de valeurs pour chaque variable explicative entre une valeur minimale et une valeur maximale spécifiées. La procédure est itérative et utilise les résultats des valeurs précédentes pour sélectionner chaque nouvelle combinaison à tester. Les valeurs finales sélectionnées auront l’AICc le plus faible. Pour l’option du nombre de voisins, le minimum et le maximum sont indiqués à l’aide des paramètres Minimum Number of Neighbors (Nombre minimum de voisins) et Maximum Number of Neighbors (Nombre maximum de voisins). Pour l’option de bande de distance le minimum et le maximum sont indiqués à l’aide des paramètres Minimum Search Distance (Distance de recherche minimale) et Maximum Search Distance (Distance de recherche maximale). Les valeurs minimale et maximale sont partagées pour toutes les variables explicatives, mais le nombre de voisins ou la bande de distance estimé sera différent pour chaque variable explicative (sauf si deux ou plus ont par hasard la même échelle spatiale). Cette option est celle dont le calcul prend le plus de temps, en particulier pour les jeux de données volumineux ou fortement dimensionnels.

    • Gradient Search (Recherche par gradient) : détermine le nombre de voisins ou la bande de distance pour chaque variable explicative à l’aide d’un algorithme d’optimisation fonctionnant selon un gradient. Pour trouver la bande passante optimale pour chaque variable explicative, la recherche par gradient prend la dérivée de l’AICc par rapport aux bandes passantes et met à jour les bandes passantes jusqu’à trouver l’AICc le plus faible. Pour l’option du nombre de voisins, le minimum et le maximum sont indiqués à l’aide des paramètres Minimum Number of Neighbors (Nombre minimum de voisins) et Maximum Number of Neighbors (Nombre maximum de voisins). Pour l’option Distance Band (Bande de distance), le minimum et le maximum sont indiqués à l’aide des paramètres Minimum Search Distance (Distance de recherche minimale) et Maximum Search Distance (Distance de recherche maximale). Comme pour la Recherche absolue, les valeurs minimale et maximale sont partagées pour toutes les variables explicatives, mais le nombre de voisins ou la bande de distance estimé sera différent pour chaque variable explicative (sauf si deux ou plus ont par hasard la même échelle spatiale). Cette option estime les voisinages comparables à la recherche absolue, mais offre une meilleure performance d’exécution et requiert beaucoup moins de mémoire.

    • Manual Intervals (Intervalles manuels) : détermine le nombre de voisins ou la bande de distance pour chaque variable explicative en incrémentant le nombre de voisins ou la bande de distance à partir d’une valeur minimale. Pour l’option du nombre de voisins, la méthode débute avec la valeur du paramètre Minimum Number of Neighbors (Nombre minimum de voisins). Le nombre de voisins est ensuite augmenté de la valeur du paramètre Number of Neighbors Increment (Incrément de nombre de voisins). Cet incrément est répété un certain nombre de fois, spécifié à l’aide du paramètre Number of Increments (Nombre d’incréments). Pour l’option de bande de distance, la méthode utilise les paramètres Minimum Search Distance (Distance de recherche minimale), Search Distance Increment (Incrément de distance de recherche) et Number of Increments (Nombre d’incréments). Le nombre de voisins ou la bande de distance utilisé par chaque variable explicative sera l’une des valeurs testées, mais les valeurs peuvent être différentes pour chaque variable explicative. Cette option est plus rapide que la recherche absolue et estime fréquemment des voisinages comparables.

    • User Defined (Défini par l’utilisateur) : le nombre de voisins ou la bande de distance qui est utilisé par les variables explicatives. La valeur est spécifiée à l’aide du paramètre Number of Neighbors (Nombre de voisins) ou du paramètre Distance Band (Bande de distance). Cette option est celle qui offre le plus de contrôle si vous connaissez les valeurs optimales.

    Par défaut, les paramètres de voisinage dépendants de chaque méthode de sélection de voisinage s’appliquent à toutes les variables explicatives. Vous pouvez toutefois fournir des paramètres de sélection de voisinage personnalisés uniquement pour certaines variables explicatives à l’aide du paramètre de remplacement correspondant pour le type de voisinage et la méthode de sélection : Number of Neighbors for Golden Search (Nombre de voisins pour la recherche absolue), Number of Neighbors for Gradient Search (Nombre de voisins pour la recherche par gradient), Number of Neighbors for Manual Intervals (Nombre de voisins pour les intervalles manuels), User Defined Number of Neighbors (Nombre de voisins défini par l’utilisateur), Search Distance for Golden Search (Distance de recherche pour la recherche absolue), Search Distance for Gradient Search (Distance de recherche pour la recherche par gradient), Search Distance for Manual Intervals (Distance de recherche pour les intervalles manuels) ou User Defined Search Distance (Distance de recherche définie par l’utilisateur). Pour utiliser des voisinages personnalisés pour certaines variables explicatives, fournissez les variables explicatives dans la première colonne du paramètre de remplacement correspondant, puis indiquez les options personnalisées du voisinage dans les autres colonnes. Les colonnes portent le même nom que les paramètres qu’elles remplacent. Par exemple, si vous utilisez des intervalles manuels avec une bande de distance, la colonne Search Distance Increment (Incrément de recherche de distance) spécifie les valeurs personnalisées du paramètre Search Distance Increment (Incrément de distance de recherche). Dans la fenêtre Geoprocessing (Géotraitement), les paramètres de voisinage personnalisés se trouvent dans la catégorie de paramètres Customized Neighborhood Options (Options de voisinage personnalisées).

    Supposons par exemple que vous utilisiez trois variables explicatives avec le type de voisinage Recherche absolue avec 30 voisins au minimum et 40 voisins au maximum. Si l’outil est exécuté avec ces paramètres, chacune des trois variables explicatives utilisera entre 30 et 40 voisins. Mais si vous voulez utiliser entre 45 et 55 voisins uniquement pour la deuxième variable explicative, vous pouvez fournir la deuxième variable explicative, la valeur minimale personnalisée et la valeur maximale personnalisée dans les colonnes du paramètre Number of Neighbors for Golden Search (Nombre de voisins pour la recherche absolue). Avec ces paramètres, les première et troisième variables explicatives utiliseront entre 30 et 40 voisins, et la deuxième variable explicative utilisera entre 45 et 55 voisins.

  • Plusieurs diagnostics de modèle sont affichés dans les messages de géotraitement qui permettent de déterminer la fiabilité du modèle MGWR. Examinez ces diagnostics avant de consulter d’autres sorties de l’outil. Si les diagnostics de modèle sont acceptables, consultez les diagrammes et la symbologie des entités en sortie pour mieux comprendre les résultats.

    En savoir plus sur les diagnostics de modèle et les sorties de l’outil

  • Évaluez les résultats et examinez si la relation entre chaque variable explicative et la variable dépendante est linéaire, si des variables explicatives sont manquantes (spécification erronée) ou redondantes (multicolinéarité), s’il existe des points aberrants ou si les résiduels ne sont pas répartis normalement. Pour plus d’informations sur les problèmes potentiels des modèles de régression, consultez la rubrique Principes de base de l’analyse de régression.

  • Pour des résultats les plus précis possibles, projetez les données dans un système de coordonnées projetées si les coordonnées sont stockées sous forme de latitude et de longitude. Ceci est particulièrement important en cas d’utilisation de l’option Distance Band (Bande de distance) du paramètre Neighborhood Type (Type de voisinage) car les optimisations nécessitent des mesures de distance précises.

  • Si vous sélectionnez le paramètre Scale Data (Données d’échelle), une couche sera créée pour chaque coefficient mis à l’échelle. Les coefficients remis à l’échelle dans les unités des données d’origine sont stockés sous forme de champs dans la classe d’entités en sortie. Si des rasters de coefficient sont créés à l’aide du paramètre Coefficient Raster Workspace (Espace de travail raster du coefficient), des couches seront créées à partir des rasters de coefficient mis à l’échelle et les rasters remis à l’échelle seront enregistrés dans l’espace de travail.

    Il est recommandé de mettre à l’échelle les variables explicatives et dépendantes. Cela est particulièrement important lorsque la plage de valeurs des variables varie significativement car la mise à l’échelle égalise les variances des valeurs des variables explicatives. Lorsque vous estimez numériquement la bande passante et les coefficients de chaque modèle local, les estimations convergent généralement plus rapidement et vers des valeurs plus précises lorsque chaque variable contribue dans la même mesure à la variance totale des données. Si les variables explicatives ont des variances différentes, les variables dont les variances sont plus importantes ont plus d’influence sur chaque étape de l’estimation itérative. Dans la plupart des cas, cette influence affecte négativement les bandes passantes et coefficients finaux du modèle.

  • Dans certains cas, l’option Manual Interval (Intervalle manuel) du paramètre (Neighborhood Selection Method (Méthode de sélection de voisinage) peut estimer une valeur AICc inférieure à celle de l’option Golden Search (Recherche absolue) même pour une recherche dans la même plage de distances ou de voisins. De même, si vous réalisez une recherche absolue ou des intervalles manuels, puis fournissez les bandes passantes ou les nombres de voisins estimés à l’aide de l’option User Defined (Défini par l’utilisateur), les sorties ne seront pas exactement les mêmes. Ces deux comportements s’expliquent par les dépendances de chemin des algorithmes de réajustement et de recherche absolue utilisés pour estimer les paramètres du modèle MGWR. Pour reproduire les mêmes résultats MGWR, vous devez exécuter l’outil avec les mêmes réglages de paramètres.

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Classe d'entités qui contient les variables dépendantes et explicatives.

Feature Layer
Variable dépendante

Champ numérique contenant les valeurs observées qui seront modélisées.

Field
Type de modèle

Spécifie le modèle de régression en fonction des valeurs de la variable dépendante. Actuellement une seule donnée continue est prise en charge et le paramètre est masqué dans la fenêtre Geoprocessing (Géotraitement). N’utilisez pas de variables dépendantes de type catégoriel, total ou binaire.

  • ContinuLa variable dépendante représente des valeurs continues. Il s’agit de l’option par défaut.
String
Variables explicatives

Liste des champs qui seront utilisés comme variables explicatives indépendantes dans le modèle de régression.

Field
Entités en sortie

La nouvelle classe d’entités contenant les coefficients, résiduels et niveaux de signification du modèle MGWR. La classe d’entités qui sera ajoutée à la fenêtre Contents (Contenu) dans un groupe de couches.

Feature Class
Type de voisinage

Indique si le voisinage sera une distance fixe ou autorisé à varier spatialement en fonction de la densité des entités.

  • Nombre de voisinsLa taille du voisinage sera un nombre spécifié de voisins les plus proches pour chaque entité. Si les entités sont denses, l’étendue spatiale du voisinage sera plus restreinte. Si les entités sont rares, l’étendue spatiale du voisinage sera plus vaste.
  • Canal de distanceLa taille du voisinage sera une distance fixe ou constante pour chaque entité.
String
Méthode de sélection des voisins

Indique la manière dont la taille du voisinage est déterminée.

  • Recherche absolueUne distance ou un nombre de voisins optimal sera déterminé en minimisant la valeur AICc à l’aide de l’algorithme de recherche absolue. Cette option est celle dont le calcul prend le plus de temps, en particulier pour les jeux de données volumineux ou fortement dimensionnels.
  • Recherche par gradientUne distance ou un nombre de voisins optimal sera déterminé en minimisant la valeur AICc à l’aide de l’algorithme d’optimisation basé sur le gradient. Cette option est la plus rapide à exécuter et requiert beaucoup moins de mémoire que la recherche absolue.
  • Intervalles manuelsUne distance ou un nombre de voisins sera identifié en testant une plage de valeurs et en déterminant la valeur ayant l’AICc le plus faible. Si le paramètre Neighborhood Type (Type de voisinage) est défini sur Distance Band (Bande de distance), la valeur minimale de cette plage sera fournie par le paramètre Minimum search distance (Distance de recherche minimale). La valeur minimum est ensuite incrémentée de la valeur spécifiée dans le paramètre Search Distance Increment (Incrément de distance de recherche). Ceci est répété le nombre de fois spécifié par le paramètre Number of increments (Nombre d’incréments). Si le paramètre Neighborhood Type (Type de voisinage) est défini sur Number of Neighbors (Nombre de voisins), la valeur minimum, la taille d’incrément et le nombre d’incréments sont fournis par les paramètres Minimum Number of Neighbors (Nombre minimum de voisins), Number of Neighbors Increment (Incrément de nombre de voisins) et Number of Increments (Nombre d’incréments), respectivement.
  • Défini par l’utilisateurLa taille du voisinage sera spécifiée soit par la valeur du paramètre Number of Neighbors (Nombre de voisins), soit par celle du paramètre Distance Band (Bande de distance).
String
Nombre minimal de voisins
(Facultatif)

Le nombre minimum de voisins que chaque entité inclura dans ses calculs. Il est recommandé d’utiliser au moins 30 voisins.

Long
Nombre maximal de voisins
(Facultatif)

Le nombre maximum de voisins que chaque entité inclura dans ses calculs.

Long
Unité de distance
(Facultatif)

Spécifie l’unité de distance qui sera utilisée pour mesurer les distances entre les entités.

  • Pied internationalLes distances seront mesurées en pieds internationaux.
  • Milles terrestresLes distances seront mesurées en miles terrestres.
  • Pieds d’arpentage américainsLes distances seront mesurées en pieds d’arpentage américains.
  • MètresLes distances seront mesurées en mètres.
  • KilomètresLes distances seront mesurées en kilomètres.
  • Milles d’arpentage américainsLes distances seront mesurées en miles d’arpentage américains.
String
Distance de recherche minimale
(Facultatif)

Distance de recherche minimale qui sera appliquée à chaque variable explicative. Il est recommandé de fournir une distance minimale comprenant au moins 30 voisins pour chaque entité.

Double
Distance de recherche maximale
(Facultatif)

La distance de recherche maximale de voisins qui sera appliquée à toutes les variables.

Double
Incrément de nombre de voisins
(Facultatif)

Le nombre de voisins en fonction duquel les intervalles manuels augmenteront pour chaque test de voisinage.

Long
Incrément de distance de recherche
(Facultatif)

La distance par laquelle les intervalles manuels augmenteront pour chaque test de voisinage.

Double
Nombre d’incréments
(Facultatif)

Le nombre de tailles de voisinage à tester lors de l’utilisation d’intervalles manuels. La première taille de voisinage est la valeur du paramètre Minimum Number of Neighbors (Nombre minimal de voisins) ou du paramètre Minimum Search Distance (Distance de recherche minimale).

Long
Nombre de voisins
(Facultatif)

Le nombre de voisins qui sera utilisé pour le type de voisinage défini par l’utilisateur.

Long
Canal de distance
(Facultatif)

La taille de la bande de distance qui sera utilisée pour le type de voisinage défini par l’utilisateur. Toutes les entités comprises dans cette distance seront incluses comme voisins dans les modèles locaux.

Double
Nombre de voisins pour la recherche absolue
(Facultatif)

Options personnalisées de recherche absolue pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, le nombre minimal de voisins et le nombre maximal de voisins dans les colonnes.

Value Table
Nombre de voisins pour les intervalles manuels
(Facultatif)

Options personnalisées d’intervalles manuels pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez le nombre minimum de voisins, l’incrément du nombre de voisins et le nombre d’incréments dans les colonnes.

Value Table
Nombre de voisins défini par l’utilisateur
(Facultatif)

Options personnalisées définies par l’utilisateur pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez le nombre de voisins.

Value Table
Distance de recherche pour la recherche absolue
(Facultatif)

Options personnalisées de recherche absolue pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, la distance de recherche minimale et la distance de recherche maximale dans les colonnes.

Value Table
Distance de recherche pour intervalles manuels
(Facultatif)

Options personnalisées d’intervalles manuels pour les variables explicatives individuelles. Pour chaque variable à personnaliser, fournissez la variable, la distance de recherche minimale, les incréments de distance de recherche et le nombre d’incréments dans les colonnes.

Value Table
Distance de recherche définie par l’utilisateur
(Facultatif)

Options personnalisées définies par l’utilisateur pour les variables explicatives individuelles. Pour chaque variable à personnaliser, fournissez la variable et la bande de distance dans les colonnes.

Value Table
Emplacements des prévisions
(Facultatif)

Une classe d’entités contenant les emplacements pour lesquelles les estimations seront calculées. Chaque entité dans ce jeu de données doit contenir une valeur pour chaque variable explicative spécifiée. La variable dépendante pour ces entités sera estimée à l’aide du modèle calibré pour les données de la classe d’entités en entrée. Ces emplacements d’entités doivent être proches des entités en entrée (dans 115 pourcent de l’étendue) ou dans la même zone d’étude que les entités en entrée.

Feature Layer
Variables explicatives à apparier
(Facultatif)

Les variables explicatives issues des emplacements de prévisions qui correspondent aux variables explicatives des classes d’entités en entrée.

Value Table
Entités prévues en sortie
(Facultatif)

La classe d’entités en sortie qui recevra des estimations de variable dépendante pour chaque emplacement de prévision.

Feature Class
Prévision fiable
(Facultatif)

Désigne les entités qui seront utilisées dans les calculs de prévision.

  • Activé : les entités avec des valeurs supérieures à plus de trois écarts types par rapport à la moyenne (points aberrants de valeur) et les entités dont les pondérations sont égales à 0 (points aberrants spatiaux) seront exclues des calculs de prévision, mais recevront des prévisions dans la classe d’entités en sortie. Il s’agit de l’option par défaut.
  • Désactivé : chaque entité sera utilisée dans les calculs de prévision.

Boolean
Structure de pondération locale
(Facultatif)

Spécifie le type de noyau qui sera utilisé pour fournir la pondération spatiale dans le modèle. Le noyau indique comment les entités sont associées entre elles dans leur voisinage.

  • BicarréUne pondération de 0 est attribuée aux entités situées en dehors du voisinage spécifié. Il s’agit de l’option par défaut.
  • GaussienToutes les entités recevront des pondérations, mais ces dernières sont réduites exponentiellement à mesure qu’elles s’éloignent de l’entité cible.
String
Table de voisinage en sortie
(Facultatif)

Une table contenant les statistiques en sortie du modèle MGWR. Un diagramme à barres des bandes passantes ou des nombres de voisins sera inclus dans la sortie.

Table
Espace de travail raster du coefficient
(Facultatif)

Espace de travail au sein duquel les rasters de coefficient vont être créés. Quand cet espace de travail est fourni, les rasters sont créés pour l’intersection et chaque variable explicative. Ce paramètre n’est disponible qu’avec une licence Desktop Advanced. Si un répertoire est fourni, les rasters seront au format TIFF (.tif).

Workspace
Données d’échelle
(Facultatif)

Indique si les valeurs des variables explicatives et dépendantes seront normalisées (également appelé Normalisation Z-score) pour que la moyenne soit égale à zéro et l’écart type à un avant d’ajuster le modèle.

  • Activé : les valeurs des variables seront mises à l’échelle. Les résultats comprendront les versions mises à l’échelle et non mises à l’échelle des coefficients des variables explicatives.
  • Désactivé : les valeurs des variables ne seront pas mises à l’échelle. Tous les coefficients seront dans les unités des données d’origine et aucun ne sera mis à l’échelle.

Boolean
Nombre de voisins pour la recherche par gradient
(Facultatif)

Options personnalisées de recherche par gradient pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, le nombre minimal de voisins et le nombre maximal de voisins dans les colonnes.

Value Table
Distance de recherche pour la recherche par gradient
(Facultatif)

Options personnalisées de recherche par gradient pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, la distance de recherche minimale et la distance de recherche maximale dans les colonnes.

Value Table

Sortie obtenue

ÉtiquetteExplicationType de données
Couches raster de coefficient

Les rasters en sortie des coefficients des variables explicatives.

Raster
Groupe de couches en sortie

Un groupe de couches des sorties. Le nom du groupe de couches est la valeur du paramètre Output Features (Entités en sortie) auquel on ajoute à la fin _MGWR_Results. Il contient la valeur résiduelle normalisée et un sous-groupe de couches distinct pour chaque variable explicative. Chaque sous-groupe de couches comprend une couche de Coefficient et une couche de Significance (Signification). Le groupe de couches sera ajouté à la fenêtre Contents (Contenu).

Group Layer

arcpy.stats.MGWR(in_features, dependent_variable, model_type, explanatory_variables, output_features, neighborhood_type, neighborhood_selection_method, {minimum_number_of_neighbors}, {maximum_number_of_neighbors}, {distance_unit}, {minimum_search_distance}, {maximum_search_distance}, {number_of_neighbors_increment}, {search_distance_increment}, {number_of_increments}, {number_of_neighbors}, {distance_band}, {number_of_neighbors_golden}, {number_of_neighbors_manual}, {number_of_neighbors_defined}, {distance_golden}, {distance_manual}, {distance_defined}, {prediction_locations}, {explanatory_variables_to_match}, {output_predicted_features}, {robust_prediction}, {local_weighting_scheme}, {output_table}, {coefficient_raster_workspace}, {scale}, {number_of_neighbors_gradient}, {distance_gradient})
NomExplicationType de données
in_features

Classe d'entités qui contient les variables dépendantes et explicatives.

Feature Layer
dependent_variable

Champ numérique contenant les valeurs observées qui seront modélisées.

Field
model_type

Spécifie le modèle de régression en fonction des valeurs de la variable dépendante. Actuellement une seule donnée continue est prise en charge et le paramètre est masqué dans la fenêtre Geoprocessing (Géotraitement). N’utilisez pas de variables dépendantes de type catégoriel, total ou binaire.

  • CONTINUOUSLa variable dépendante représente des valeurs continues. Il s’agit de l’option par défaut.
String
explanatory_variables
[explanatory_variables,...]

Liste des champs qui seront utilisés comme variables explicatives indépendantes dans le modèle de régression.

Field
output_features

La nouvelle classe d’entités contenant les coefficients, résiduels et niveaux de signification du modèle MGWR.

Feature Class
neighborhood_type

Indique si le voisinage sera une distance fixe ou autorisé à varier spatialement en fonction de la densité des entités.

  • NUMBER_OF_NEIGHBORSLa taille du voisinage sera un nombre spécifié de voisins les plus proches pour chaque entité. Si les entités sont denses, l’étendue spatiale du voisinage sera plus restreinte. Si les entités sont rares, l’étendue spatiale du voisinage sera plus vaste.
  • DISTANCE_BANDLa taille du voisinage sera une distance fixe ou constante pour chaque entité.
String
neighborhood_selection_method

Indique la manière dont la taille du voisinage est déterminée.

  • GOLDEN_SEARCHUne distance ou un nombre de voisins optimal sera déterminé en minimisant la valeur AICc à l’aide de l’algorithme de recherche absolue. Cette option est celle dont le calcul prend le plus de temps, en particulier pour les jeux de données volumineux ou fortement dimensionnels.
  • GRADIENT_SEARCHUne distance ou un nombre de voisins optimal sera déterminé en minimisant la valeur AICc à l’aide de l’algorithme d’optimisation basé sur le gradient. Cette option est la plus rapide à exécuter et requiert beaucoup moins de mémoire que la recherche absolue.
  • MANUAL_INTERVALSUne distance ou un nombre de voisins sera identifié en testant une plage de valeurs et en déterminant la valeur ayant l’AICc le plus faible. Si le paramètre neighborhood_type est défini sur DISTANCE_BAND, la valeur minimum de cette plage est fournie par le paramètre minimum_search_distance. La valeur minimale est ensuite incrémentée de la valeur spécifiée dans le paramètre search_distance_increment. Cet incrément est répété le nombre de fois spécifié par le paramètre number_of_increments. Si le paramètre neighborhood_type est défini sur NUMBER_OF_NEIGHBORS, la valeur minimum, la taille d’incrémentation et le nombre d’incrémentations sont fournis respectivement par les paramètres minimum_number_of_neighbors, number_of_neighbors_increment et number_of_increments.
  • USER_DEFINEDLa taille du voisinage sera spécifiée soit par la valeur du paramètre number_of_neighbors, soit par la valeur du paramètre distance_band.
String
minimum_number_of_neighbors
(Facultatif)

Le nombre minimum de voisins que chaque entité inclura dans ses calculs. Il est recommandé d’utiliser au moins 30 voisins.

Long
maximum_number_of_neighbors
(Facultatif)

Le nombre maximum de voisins que chaque entité inclura dans ses calculs.

Long
distance_unit
(Facultatif)

Spécifie l’unité de distance qui sera utilisée pour mesurer les distances entre les entités.

  • FEETINTLes distances seront mesurées en pieds internationaux.
  • MILESINTLes distances seront mesurées en miles terrestres.
  • FEETLes distances seront mesurées en pieds d’arpentage américains.
  • METERSLes distances seront mesurées en mètres.
  • KILOMETERSLes distances seront mesurées en kilomètres.
  • MILESLes distances seront mesurées en miles d’arpentage américains.
String
minimum_search_distance
(Facultatif)

Distance de recherche minimale qui sera appliquée à chaque variable explicative. Il est recommandé de fournir une distance minimale comprenant au moins 30 voisins pour chaque entité.

Double
maximum_search_distance
(Facultatif)

La distance de recherche maximale de voisins qui sera appliquée à toutes les variables.

Double
number_of_neighbors_increment
(Facultatif)

Le nombre de voisins en fonction duquel les intervalles manuels augmenteront pour chaque test de voisinage.

Long
search_distance_increment
(Facultatif)

La distance par laquelle les intervalles manuels augmenteront pour chaque test de voisinage.

Double
number_of_increments
(Facultatif)

Le nombre de tailles de voisinage à tester lors de l’utilisation d’intervalles manuels. La première taille de voisinage est la valeur du paramètre minimum_number_of_neighbors ou du paramètre minimum_search_distance.

Long
number_of_neighbors
(Facultatif)

Le nombre de voisins qui sera utilisé pour le type de voisinage défini par l’utilisateur.

Long
distance_band
(Facultatif)

La taille de la bande de distance qui sera utilisée pour le type de voisinage défini par l’utilisateur. Toutes les entités comprises dans cette distance seront incluses comme voisins dans les modèles locaux.

Double
number_of_neighbors_golden
[number_of_neighbors_golden,...]
(Facultatif)

Options personnalisées de recherche absolue pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, le nombre minimal de voisins et le nombre maximal de voisins dans les colonnes.

Value Table
number_of_neighbors_manual
[number_of_neighbors_manual,...]
(Facultatif)

Options personnalisées d’intervalles manuels pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez le nombre minimum de voisins, l’incrément du nombre de voisins et le nombre d’incréments dans les colonnes.

Value Table
number_of_neighbors_defined
[number_of_neighbors_defined,...]
(Facultatif)

Options personnalisées définies par l’utilisateur pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez le nombre de voisins.

Value Table
distance_golden
[distance_golden,...]
(Facultatif)

Options personnalisées de recherche absolue pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, la distance de recherche minimale et la distance de recherche maximale dans les colonnes.

Value Table
distance_manual
[distance_manual,...]
(Facultatif)

Options personnalisées d’intervalles manuels pour les variables explicatives individuelles. Pour chaque variable à personnaliser, fournissez la variable, la distance de recherche minimale, les incréments de distance de recherche et le nombre d’incréments dans les colonnes.

Value Table
distance_defined
[distance_defined,...]
(Facultatif)

Options personnalisées définies par l’utilisateur pour les variables explicatives individuelles. Pour chaque variable à personnaliser, fournissez la variable et la bande de distance dans les colonnes.

Value Table
prediction_locations
(Facultatif)

Une classe d’entités contenant les emplacements pour lesquelles les estimations seront calculées. Chaque entité dans ce jeu de données doit contenir une valeur pour chaque variable explicative spécifiée. La variable dépendante pour ces entités sera estimée à l’aide du modèle calibré pour les données de la classe d’entités en entrée. Ces emplacements d’entités doivent être proches des entités en entrée (dans 115 pourcent de l’étendue) ou dans la même zone d’étude que les entités en entrée.

Feature Layer
explanatory_variables_to_match
[explanatory_variables_to_match,...]
(Facultatif)

Les variables explicatives issues des emplacements de prévisions qui correspondent aux variables explicatives des classes d’entités en entrée.

Value Table
output_predicted_features
(Facultatif)

La classe d’entités en sortie qui recevra des estimations de variable dépendante pour chaque emplacement de prévision.

Feature Class
robust_prediction
(Facultatif)

Désigne les entités qui seront utilisées dans les calculs de prévision.

  • ROBUSTLes entités avec des valeurs supérieures à plus de trois écarts types par rapport à la moyenne (points aberrants de valeur) et les entités dont les pondérations sont égales à 0 (points aberrants spatiaux) seront exclues des calculs de prévision, mais recevront des prévisions dans la classe d’entités en sortie. Il s’agit de l’option par défaut.
  • NON_ROBUSTChaque entité sera utilisée dans les calculs de prévision.
Boolean
local_weighting_scheme
(Facultatif)

Spécifie le type de noyau qui sera utilisé pour fournir la pondération spatiale dans le modèle. Le noyau indique comment les entités sont associées entre elles dans leur voisinage.

  • BISQUAREUne pondération de 0 est attribuée aux entités situées en dehors du voisinage spécifié. Il s’agit de l’option par défaut.
  • GAUSSIANToutes les entités recevront des pondérations, mais ces dernières sont réduites exponentiellement à mesure qu’elles s’éloignent de l’entité cible.
String
output_table
(Facultatif)

Une table contenant les statistiques en sortie du modèle MGWR. Un diagramme à barres des bandes passantes ou des nombres de voisins sera inclus dans la sortie.

Table
coefficient_raster_workspace
(Facultatif)

Espace de travail au sein duquel les rasters de coefficient vont être créés. Quand cet espace de travail est fourni, les rasters sont créés pour l’intersection et chaque variable explicative. Ce paramètre n’est disponible qu’avec une licence Desktop Advanced. Si un répertoire est fourni, les rasters seront au format TIFF (.tif).

Workspace
scale
(Facultatif)

Indique si les valeurs des variables explicatives et dépendantes seront mises à l’échelle pour que la moyenne soit égale à zéro et l’écart type à un avant d’ajuster le modèle.

  • SCALE_DATALes valeurs des variables seront mises à l’échelle. Les résultats comprendront les versions mises à l’échelle et non mises à l’échelle des coefficients des variables explicatives.
  • NO_SCALE_DATALes valeurs des variables ne seront pas mises à l’échelle. Tous les coefficients seront dans les unités des données d’origine et aucun ne sera mis à l’échelle.
Boolean
number_of_neighbors_gradient
[number_of_neighbors_gradient,...]
(Facultatif)

Options personnalisées de recherche par gradient pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, le nombre minimal de voisins et le nombre maximal de voisins dans les colonnes.

Value Table
distance_gradient
[distance_gradient,...]
(Facultatif)

Options personnalisées de recherche par gradient pour les variables explicatives individuelles. Pour chaque variable explicative à personnaliser, fournissez la variable, la distance de recherche minimale et la distance de recherche maximale dans les colonnes.

Value Table

Sortie obtenue

NomExplicationType de données
coefficient_raster_layers

Les rasters en sortie des coefficients des variables explicatives.

Raster
output_layer_group

Un groupe de couches des sorties. Le nom du groupe de couches est la valeur du paramètre Output Features (Entités en sortie) auquel on ajoute à la fin _MGWR_Results. Il contient la valeur résiduelle normalisée et un sous-groupe de couches distinct pour chaque variable explicative. Chaque sous-groupe de couches comprend une couche de Coefficient et une couche de Significance (Signification). Le groupe de couches sera ajouté à la fenêtre Contents (Contenu).

Group Layer

Exemple de code

Exemple 1 d’utilisation de l’outil MGWR (fenêtre Python)

Le script de la fenêtre Python ci-après illustre l’utilisation de la fonction MGWR.


import arcpy
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")
Exemple 2 d’utilisation de l’outil MGWR (script autonome)

Le script Python autonome ci-dessous illustre l’utilisation de la fonction MGWR.

# Run MGWR to predict house prices using "Number of Neighbors" and "Golden Search"
# Import modules
import arcpy

# Set the current workspace
arcpy.env.workspace = "C:/data"

# Run MGWR 
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")