Geographisch gewichtete Regression (Multiscale) (MGWR) (Spatial Statistics)

Zusammenfassung

Führt eine geographisch gewichtete Regression vom Typ "Multiscale" (MGWR) durch. Dabei handelt es sich um eine lokale Form der linearen Regression zur Modellierung räumlich variierender Beziehungen.

MGWR baut auf der geographisch gewichteten Regression (GWR) auf. Dies ist ein lokales Regressionsmodell, bei dem die Koeffizienten der erklärenden Variable im Raum variieren können. Jede erklärende Variable kann in einem anderen räumlichen Maßstab arbeiten. Im Gegensatz zu GWR wird dies durch MGWR berücksichtigt, indem für jede erklärende Variable eine andere Nachbarschaft (Bandbreite) zugelassen wird. Die Nachbarschaft (Bandbreite) einer erklärenden Variable bestimmt die Features, die zum Schätzen des Koeffizienten dieser erklärenden Variable im linearen Regressionsmodell, das bei einem Ziel-Feature geeignet ist, verwendet werden.

Weitere Informationen zur Funktionsweise von "Geographisch gewichtete Regression (Multiscale) (MGWR)"

Abbildung

Abbildung des Werkzeugs "Geographisch gewichtete Regression (Multiscale)"
Auf die Nachbarschaft jeder erklärenden Variablen wird ein Biquadrat-Kernel angewendet. Jede erklärende Variable verwendet eine andere Bandbreite, um verschiedene räumliche Beziehungen zu erfassen.

Verwendung

  • Am effektivsten ist dieses Werkzeug für Datasets mit mindestens einigen hundert Features. Für kleine Datasets ist dieses Werkzeug nicht geeignet. Das Werkzeug funktioniert nicht mit Multipoint-Daten.

  • Verwenden Sie den Parameter Eingabe-Features mit einem Feld, das das Phänomen darstellt, das Sie modellieren (Wert für Abhängige Variable), und einem oder mehreren Feldern, die den Wert für Erklärende Variable(n) darstellen. Diese Felder müssen numerisch sein und einen Wertebereich beinhalten. Features, bei denen Werte in der abhängigen oder erklärenden Variablen fehlen, werden von der Analyse ausgeschlossen. Sie können jedoch mit dem Werkzeug Fehlende Werte ausfüllen das Dataset vervollständigen, bevor Sie das Werkzeug Geographisch gewichtete Regression (Multiscale) ausführen.

  • Das aktuelle Modell akzeptiert nur abhängige Variablen, die kontinuierliche Werte darstellen. Verwenden Sie das Werkzeug nicht mit abhängigen Variablen des Typs "Anzahl" oder "Anteil" oder mit abhängigen binären Variablen (Indikatorvariablen). Aktuell ist die Option Kontinuierlich des Parameters Modelltyp die einzige unterstützte Option. In künftigen Versionen können weitere Optionen hinzugefügt werden.

    Wenn eine nicht kontinuierliche abhängige Variable angegeben wird, sind die Ergebnisse möglicherweise weniger aussagekräftig, wie z. B. Vorhersagen mit negativer Anzahl oder Wahrscheinlichkeiten, die größer als 1 sind.

    Vorsicht:

    Erklärende Variablen (nicht abhängige Variablen) können einen beliebigen Typ aufweisen, jedoch ist bei der Verwendung erklärender Variablen des Typs "Anzahl", "Anteil" oder "Binär" Vorsicht geboten. Bei lokalen Regressionsmodellen, die nicht kontinuierliche erklärende Variablen verwenden, treten häufig lokale Multikollinearitätsprobleme auf. Wenn erklärende Variablen entweder global oder lokal stark miteinander korrelieren, kann die Ausführung des Werkzeugs aufgrund von Multikollinearität mit dem Fehler 110222 fehlschlagen.

    Weitere Informationen zu Multikollinearität

  • Es sollten sowohl globale als auch lokale Variationen in den Feldern der Parameter Abhängige Variable und Erklärende Variablen angegeben werden. Verwenden Sie keine Felder, die einen einzigen konstanten Wert enthalten, keine erklärenden Indikatorvariablen, die verschiedene räumliche Ordnungen darstellen, und keine kategorialen Variablen, die räumlich gruppiert sind.

  • Um erklärende kategoriale Variablen zu verwenden, müssen die Kategorien mit dem Werkzeug Feld codieren in Indikatorvariablen (0 oder 1) konvertiert werden. Diese Indikatorvariablen können Sie dann als erklärende Variablen im Werkzeug Geographisch gewichtete Regression (Multiscale) verwenden.

  • Dieses Werkzeug gibt eine Feature-Class aus und fügt Felder mit den lokalen Diagnosewerten hinzu. Die Werte vom Typ Ausgabe-Features und verknüpfte Diagramme werden automatisch dem Inhaltsverzeichnis hinzugefügt, wobei ein divergierendes Farbschema auf Modellresiduen angewendet wird.

  • Für den Parameter Auswahlmethode für Nachbarschaften gibt es vier Optionen. Der Parameter kann verwendet werden, um den optimalen räumlichen Maßstab für jede erklärende Variable zu schätzen:

    • Golden Search: Bestimmt die Anzahl der Nachbarn oder das Entfernungsband für jede erklärende Variable mithilfe des Golden-Search-Algorithmus. Bei dieser Methode werden mehrere Kombinationen von Werten für jede erklärende Variable zwischen einem angegebenen Minimal- und Maximalwert gesucht. Der Prozess ist iterativ. Er verwendet die Ergebnisse von vorherigen Werten, um jeweils eine neue zu testende Kombination auszuwählen. Die Werte, die zum Schluss ausgewählt werden, weisen den kleinsten AICc auf. Für die Option "Anzahl der Nachbarn" werden der Minimal- und der Maximalwert mit den Parametern Minimale Anzahl von Nachbarn und Maximale Anzahl von Nachbarn angegeben. Für die Option "Entfernungsband" werden der Minimal- und der Maximalwert mit den Parametern Minimale Suchentfernung und Maximale Suchentfernung angegeben. Die Mindest- und Maximalwerte werden für alle erklärenden Variablen übernommen. Die geschätzte Anzahl der Nachbarn oder das Entfernungsband sind jedoch für jede erklärende Variable unterschiedlich (sofern nicht zwei oder mehr Variablen zufällig denselben räumlichen Maßstab aufweisen). Bei dieser Option dauert die Berechnung am längsten, insbesondere bei großen oder hochdimensionalen Datasets.

    • Gradientensuche: Bestimmt die Anzahl der Nachbarn oder das Entfernungsband für jede erklärende Variable mithilfe eines Gradienten-basierten Optimierungsalgorithmus. Um die optimale Bandbreite für jede erklärende Variable zu finden, verwendet die Gradientensuche die Ableitung von AICc in Bezug auf die Bandbreiten und aktualisiert die Bandbreiten, bis der kleinste AICc-Wert gefunden ist. Für die Option "Anzahl der Nachbarn" werden der Minimal- und der Maximalwert mit den Parametern Minimale Anzahl von Nachbarn und Maximale Anzahl von Nachbarn angegeben. Für die Option Entfernungsband werden der Minimal- und der Maximalwert mit den Parametern Minimale Suchentfernung und Maximale Suchentfernung angegeben. Die Mindest- und Maximalwerte werden wie bei Golden Search für alle erklärenden Variablen übernommen. Die geschätzte Anzahl der Nachbarn oder das Entfernungsband können jedoch für jede erklärende Variable unterschiedlich sein (sofern nicht zwei oder mehr Variablen denselben räumlichen Maßstab aufweisen). Die Ergebnisse der Schätzung der Nachbarschaften mit dieser Option sind mit denen von Golden Search vergleichbar. Allerdings ist diese Option schneller und kommt mit signifikant weniger Speicherauslastung aus.

    • Manuelle Intervalle: Bestimmt die Anzahl der Nachbarn oder das Entfernungsband für jede erklärende Variable, indem die Anzahl der Nachbarn oder das Entfernungsband ausgehend von einem Minimalwert inkrementiert wird. Für die Option "Anzahl der Nachbarn" beginnt die Methode mit dem Wert des Parameters Minimale Anzahl von Nachbarn. Die Anzahl der Nachbarn wird dann um den Wert des Parameters Inkrement für die Anzahl der Nachbarn erhöht. Dieses Inkrement wird so viele Male wiederholt, wie im Parameter Anzahl von Inkrementen angegeben. Für die Option "Entfernungsband" verwendet die Methode die Parameter Minimale Suchentfernung, Inkrement für die Suchentfernung und Anzahl von Inkrementen. Die Anzahl der Nachbarn oder das Entfernungsband, die bzw. das von jeder erklärenden Variablen verwendet wird, ist einer der getesteten Werte, aber die Werte können für jede erklärende Variable unterschiedlich sein. Diese Option ist schneller als die Option "Golden Search" und wird häufig zur Schätzung vergleichbarer Nachbarschaften genutzt.

    • Benutzerdefiniert: Die Anzahl der Nachbarn oder das Entfernungsband, die bzw. das von allen erklärenden Variablen verwendet wird. Der Wert wird mit dem Parameter Anzahl der Nachbarn bzw. Entfernungsband angegeben. Diese Option bietet die größte Kontrolle, wenn Sie die optimalen Werte kennen.

    Standardmäßig werden die abhängigen Nachbarschaftsparameter jeder Auswahlmethode für Nachbarschaften auf alle erklärenden Variablen angewendet. Es können jedoch nur für bestimmte erklärende Variablen angepasste Parameter für die Auswahl der Nachbarschaft mit dem entsprechenden Override-Parameter für den Nachbarschaftstyp und die Auswahlmethode angegeben werden: Anzahl der Nachbarn für Golden Search, Anzahl der Nachbarn für Gradientensuche, Anzahl der Nachbarn für manuelle Intervalle, Benutzerdefinierte Anzahl der Nachbarn, Suchentfernung für Golden Search, Suchentfernung für Gradientensuche, Suchentfernung für manuelle Intervalle oder Benutzerdefinierte Suchentfernung. Um angepasste Nachbarschaften für bestimmte erklärende Variablen zu verwenden, geben Sie die erklärenden Variablen in der ersten Spalte des entsprechenden Override-Parameters und die angepassten Optionen der Nachbarschaft in den anderen Spalten an. Die Spalten haben dieselben Namen wie die Parameter, die sie überschreiben. Wenn Sie beispielsweise manuelle Intervalle mit Entfernungsband verwenden, enthält die Spalte Inkrement für die Suchentfernung angepasste Werte des Parameters Inkrement für die Suchentfernung. Im Bereich Geoverarbeitung befinden sich die angepassten Nachbarschaftsparameter in der Parameterkategorie Optionen für angepasste Nachbarschaften.

    Angenommen, Sie verwenden drei erklärende Variablen mit dem Nachbarschaftstyp "Golden Search" mit einer minimalen Anzahl von 30 und einer maximalen Anzahl von 40 Nachbarn. Wenn das Werkzeug mit diesen Parametern ausgeführt wird, verwendet jede der drei erklärenden Variablen zwischen 30 und 40 Nachbarn. Wenn Sie stattdessen nur für die zweite erklärende Variable zwischen 45 und 55 Nachbarn verwenden möchten, können Sie die zweite erklärende Variable, das angepasste Minimum und das angepasste Maximum in den Spalten des Parameters Anzahl der Nachbarn für Golden Search angeben. Mit diesen Parametern verwenden die erste und die dritte erklärende Variable zwischen 30 und 40 Nachbarn, und die zweite erklärende Variable verwendet zwischen 45 und 55 Nachbarn.

  • Die Geoverarbeitungsmeldungen enthalten mehrere Modelldiagnosen, anhand derer die Zuverlässigkeit des MGWR-Modells eingeschätzt werden kann. Überprüfen Sie diese Diagnosen, bevor Sie andere Werkzeugausgaben anzeigen. Wenn die Modelldiagnosen akzeptabel sind, zeigen Sie die Diagramme und die Symbolisierung der Ausgabe-Features an, um die Ergebnisse besser nachvollziehen zu können.

    Weitere Informationen zu Modelldiagnosen und Werkzeugausgaben

  • Werten Sie die Ergebnisse aus, und prüfen Sie dabei, ob die Beziehung zwischen den einzelnen erklärenden Variablen und der abhängigen Variablen linear ist, ob erklärende Variablen fehlen (falsche Angabe) oder redundant sind (Multikollinearität), ob es Ausreißer gibt und ob die Residuen nicht normal verteilt sind. Weitere Informationen zu möglichen Problemen bei Regressionsmodellen finden Sie unter Grundlagen zur Regressionsanalyse.

  • Um möglichst genaue Ergebnisse zu erhalten, projizieren Sie die Daten in ein projiziertes Koordinatensystem, wenn die Koordinaten als Längen- und Breitengrad gespeichert sind. Dies ist besonders wichtig, wenn die Option Entfernungsband des Parameters Nachbarschaftstyp verwendet wird, weil für die Optimierungen exakte Entfernungsmessungen erforderlich sind.

  • Wenn Sie den Parameter Daten skalieren aktivieren, wird für jeden skalierten Koeffizienten ein Layer erstellt. Die Koeffizienten, die erneut auf die ursprünglichen Dateneinheiten skaliert werden, werden als Felder in der Ausgabe-Feature-Class gespeichert. Wenn Koeffizienten-Raster mit dem Parameter Koeffizienten-Raster-Workspace erstellt werden, werden Layer der skalierten Koeffizienten-Raster erstellt und die erneut skalierten Raster im Workspace gespeichert.

    Es empfiehlt sich, die erklärenden und die abhängigen Variablen zu skalieren. Dies ist besonders wichtig, wenn der Wertebereich der Variablen stark variiert, weil die Skalierung die Varianzen der Werte der erklärenden Variablen ausgleicht. Wenn die Bandbreite und die Koeffizienten jedes lokalen Modells numerisch geschätzt werden, konvergieren die Schätzungen in der Regel schneller und zu genaueren Werten, wenn die einzelnen Variablen zu gleichen Teilen zur Gesamtvarianz der Daten beitragen. Wenn die erklärenden Variablen unterschiedliche Varianzen aufweisen, haben die Variablen mit größeren Varianzen mehr Einfluss auf die einzelnen Schritte der iterativen Schätzung. In den meisten Fällen hat dieser Einfluss negative Auswirkungen auf die endgültigen Bandbreiten und Koeffizienten für das Modell.

  • Mitunter kann es vorkommen, dass die Option Manuelles Intervall für den Parameter Auswahlmethode für Nachbarschaften einen niedrigeren AICc-Wert schätzt als die Option Golden Search, selbst wenn derselbe Entfernungsbereich oder dieselben Nachbarn durchsucht werden. Ähnlich verhält es sich, wenn Sie Golden Search oder manuelle Intervalle verwenden und dann die geschätzten Bandbreiten oder die Anzahl der Nachbarn mit der Option Benutzerdefiniert angeben. Auch hier sind die Ausgaben nicht genau identisch. In beiden Fällen sind die Abweichungen auf die Pfadabhängigkeiten des Golden-Search-Algorithmus und des Rückanpassungsalgorithmus zurückzuführen, die zur Schätzung der MGWR-Modellparameter verwendet werden. Um die gleichen MGWR-Ergebnisse zu reproduzieren, müssen Sie das Werkzeug mit den gleichen Parametereinstellungen ausführen.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features

Die Feature-Class, die die abhängigen und erklärenden Variablen enthält.

Feature Layer
Abhängige Variable

Das numerische Feld mit den beobachteten Werten, die modelliert werden.

Field
Modelltyp

Gibt das Regressionsmodell auf Basis der Werte der abhängigen Variablen an. Aktuell werden nur kontinuierliche Daten unterstützt, und der Parameter ist im Bereich Geoverarbeitung ausgeblendet. Verwenden Sie keine abhängigen kategorialen oder binären Variablen sowie keine abhängigen Variablen des Typs "Anzahl".

  • KontinuierlichDie abhängige Variable stellt kontinuierliche Werte dar. Dies ist die Standardeinstellung.
String
Erklärende Variablen

Eine Liste der Felder, die als unabhängige erklärende Variablen im Regressionsmodell verwendet werden.

Field
Ausgabe-Features

Die neue Feature-Class, die die Koeffizienten, Residuen und Signifikanzniveaus des MGWR-Modells enthält. Die Feature-Class wird dem Bereich Inhalt in einem Gruppen-Layer hinzugefügt.

Feature Class
Nachbarschaftstyp

Gibt an, ob die Nachbarschaft eine feste Entfernung ist oder abhängig von der Dichte der Features räumlich schwanken darf.

  • Anzahl der NachbarnDie Nachbarschaftsgröße ist eine angegebene Anzahl der nächsten Nachbarn für jedes Feature. Wo die Features dicht sind, ist die räumliche Ausdehnung der Nachbarschaft kleiner. Bei wenigen Features ist die räumliche Ausdehnung der Nachbarschaft größer.
  • EntfernungsbandDie Nachbarschaftsgröße ist eine konstante oder feste Entfernung für jedes Feature.
String
Auswahlmethode für Nachbarschaften

Gibt an, wie die Nachbarschaftsgröße bestimmt wird.

  • Golden SearchEine optimale Entfernung oder optimale Anzahl der Nachbarn wird ermittelt, indem der AICc-Wert mithilfe des Golden-Search-Algorithmus minimiert wird. Bei dieser Option dauert die Berechnung am längsten, insbesondere bei großen oder hochdimensionalen Datasets.
  • GradientensucheEine optimale Entfernung oder optimale Anzahl der Nachbarn wird ermittelt, indem der AICc-Wert mithilfe des Gradienten-basierten Optimierungsalgorithmus minimiert wird. Diese Option wird am schnellsten ausgeführt und kommt im Vergleich zur Option "Golden Search" mit signifikant weniger Speicherauslastung aus.
  • Manuelle IntervalleEine Entfernung oder Anzahl der Nachbarn wird ermittelt, indem ein Wertebereich festgelegt und der Wert mit dem kleinsten AICc ausgewählt wird. Wenn der Parameter Nachbarschaftstyp auf Entfernungsband gesetzt ist, wird der Minimalwert dieses Bereichs durch den Parameter Minimale Suchentfernung angegeben. Der Minimalwert wird dann um den im Parameter Inkrement für die Suchentfernung angegebenen Wert erhöht. Dieses Inkrement wird so viele Male wiederholt, wie im Parameter Anzahl von Inkrementen angegeben. Wenn der Parameter Nachbarschaftstyp auf Anzahl der Nachbarn festgelegt ist, werden der Minimalwert, die Inkrementgröße und die Anzahl der Inkremente durch die Parameter Minimale Anzahl von Nachbarn, Inkrement für die Anzahl der Nachbarn bzw. Anzahl von Inkrementen angegeben.
  • BenutzerdefiniertDie Nachbarschaftsgröße wird mit dem Parameterwert Anzahl der Nachbarn oder Entfernungsband angegeben.
String
Minimale Anzahl von Nachbarn
(optional)

Die minimale Anzahl von Nachbarn, die jedes Feature in die Berechnungen einbezieht. Empfohlen wird, mindestens 30 Nachbarn zu verwenden.

Long
Maximale Anzahl von Nachbarn
(optional)

Die maximale Anzahl von Nachbarn, die jedes Feature in die Berechnungen einbezieht.

Long
Entfernungseinheit
(optional)

Gibt die Einheit für die Entfernung an, die zur Messung der Entfernungen zwischen Features verwendet wird.

  • Fuß (international)Entfernungen werden in internationalen Fuß gemessen.
  • Meilen (Statute Miles)Entfernungen werden in Meilen gemessen.
  • US Survey FeetEntfernungen werden in US Survey-Fuß gemessen.
  • MeterEntfernungen werden in Metern gemessen.
  • KilometerEntfernungen werden in Kilometern gemessen.
  • US Survey MilesEntfernungen werden in US Survey-Meilen gemessen.
String
Minimale Suchentfernung
(optional)

Die minimale Suchentfernung, die auf alle erklärenden Variablen angewendet wird. Es wird empfohlen, eine minimale Entfernung anzugeben, die mindestens 30 Nachbarn für jedes Feature umfasst.

Double
Maximale Suchentfernung
(optional)

Die maximale Suchentfernung, die auf alle Variablen angewendet wird.

Double
Inkrement für die Anzahl der Nachbarn
(optional)

Die Anzahl der Nachbarn, um die die manuellen Intervalle für jeden Nachbarschaftstest vergrößert werden.

Long
Inkrement für die Suchentfernung
(optional)

Die Entfernung, um die die manuellen Intervalle für jeden Nachbarschaftstest vergrößert werden.

Double
Anzahl von Inkrementen
(optional)

Die Anzahl der zu testenden Nachbarschaftsgrößen bei der Verwendung manueller Intervalle. Die erste Nachbarschaftsgröße ist der Wert des Parameters Minimale Anzahl von Nachbarn oder Minimale Suchentfernung.

Long
Anzahl der Nachbarn
(optional)

Die Anzahl der Nachbarn, die für den Nachbarschaftstyp "Benutzerdefiniert" verwendet werden.

Long
Entfernungsband
(optional)

Die Größe des Entfernungsbands, das für den Nachbarschaftstyp "Benutzerdefiniert" verwendet wird. Alle Features innerhalb dieser Entfernung werden als Nachbarn in die lokalen Modelle aufgenommen.

Double
Anzahl der Nachbarn für Golden Search
(optional)

Die angepassten Optionen für Golden Search für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Anzahl von Nachbarn und die maximale Anzahl von Nachbarn in den Spalten an.

Value Table
Anzahl der Nachbarn für manuelle Intervalle
(optional)

Die Optionen für angepasste manuelle Intervalle für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die minimale Anzahl von Nachbarn, das Inkrement für die Anzahl der Nachbarn und die Anzahl der Inkremente in den Spalten an.

Value Table
Benutzerdefinierte Anzahl der Nachbarn
(optional)

Die angepassten benutzerdefinierten Optionen für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Anzahl der Nachbarn an.

Value Table
Suchentfernung für Golden Search
(optional)

Die angepassten Optionen für Golden Search für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Suchentfernung und die maximale Suchentfernung in den Spalten an.

Value Table
Suchentfernung für manuelle Intervalle
(optional)

Die Optionen für angepasste manuelle Intervalle für einzelne erklärende Variablen. Geben Sie für jede anzupassende Variable die Variable, die minimale Suchentfernung, die Inkremente für die Suchentfernung und die Anzahl der Inkremente in den Spalten an.

Value Table
Benutzerdefinierte Suchentfernung
(optional)

Die angepassten benutzerdefinierten Optionen für einzelne erklärende Variablen. Geben Sie für jede anzupassende Variable die Variable und das Entfernungsband in den Spalten an.

Value Table
Vorherzusagende Positionen
(optional)

Eine Feature-Class mit den Positionen, an denen Schätzungen berechnet werden. Jedes Feature in diesem Dataset sollte einen Wert für alle angegebenen erklärenden Variablen enthalten. Die abhängige Variable für diese Features wird anhand des Modells geschätzt, das für die Eingabe-Feature-Class-Daten kalibriert wurde. Diese Feature-Positionen sollten sich innerhalb desselben Untersuchungsgebiets befinden wie die Eingabe-Features oder in dessen Nähe (innerhalb von 115 Prozent der Ausdehnung).

Feature Layer
Abzugleichende erklärende Variablen
(optional)

Die erklärenden Variablen der vorherzusagenden Positionen, die mit den entsprechenden erklärenden Variablen der Eingabe-Features übereinstimmen.

Value Table
Vorhergesagte Ausgabe-Features
(optional)

Die Ausgabe-Feature-Class zum Empfangen abhängiger Variablenschätzungen für jede vorherzusagende Position.

Feature Class
Zuverlässige Vorhersage
(optional)

Gibt die Features an, die in den Vorhersageberechnungen verwendet werden.

  • Aktiviert: Features, die mehr als drei Standardabweichungen vom Mittelwert abweichen (Wertausreißer), und Features mit der Gewichtung 0 (räumliche Ausreißer) werden aus den Vorhersageberechnungen ausgeschlossen, erhalten aber Vorhersagen in der Ausgabe-Feature-Class. Dies ist die Standardeinstellung.
  • Deaktiviert: Alle Features werden in den Vorhersageberechnungen verwendet.

Boolean
Lokales Gewichtungsschema
(optional)

Gibt den Kernel-Typ an, mit dem die räumliche Gewichtung im Modell bereitgestellt wird. Der Kernel definiert, in welchem Zusammenhang die einzelnen Features mit anderen Features in ihrer Nachbarschaft stehen.

  • BiquadratEinem Feature außerhalb der angegebenen Nachbarschaft wird die Gewichtung 0 zugewiesen. Dies ist die Standardeinstellung.
  • GaußAlle Features erhalten Gewichtungen, die Gewichtungen werden jedoch mit der Entfernung vom Ziel-Feature exponentiell kleiner.
String
Ausgabe-Nachbarschaftstabelle
(optional)

Eine Tabelle mit den Ausgabestatistiken des MGWR-Modells. Ein Balkendiagramm mit den geschätzten Bandbreiten oder der geschätzten Anzahl der Nachbarn wird in die Ausgabe aufgenommen.

Table
Koeffizienten-Raster-Workspace
(optional)

Der Workspace, in dem Koeffizienten-Raster erstellt werden. Wenn dieser Workspace bereitgestellt wird, werden Raster für den Intercept und jede erklärende Variable erstellt. Dieser Parameter ist nur mit einer Desktop Advanced-Lizenz verfügbar. Wenn ein Verzeichnis angegeben wird, weisen die Raster den Raster-Typ TIFF (.tif) auf.

Workspace
Daten skalieren
(optional)

Gibt an, ob die Werte der erklärenden und abhängigen Variablen vor dem Anpassen des Modells standardisiert werden sollen (wird auch als Z-Wert-Standardisierung bezeichnet), sodass sie einen Mittelwert von null und eine Standardabweichung von eins aufweisen.

  • Aktiviert: Die Werte der Variablen werden skaliert. Die Ergebnisse enthalten skalierte und nicht skalierte Versionen der Koeffizienten von erklärenden Variablen.
  • Deaktiviert: Die Werte der Variablen werden nicht skaliert. Alle Koeffizienten liegen nicht skaliert und in den ursprünglichen Dateneinheiten vor.

Boolean
Anzahl der Nachbarn für Gradientensuche
(optional)

Die Optionen für die angepasste Gradientensuche für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Anzahl von Nachbarn und die maximale Anzahl von Nachbarn in den Spalten an.

Value Table
Suchentfernung für Gradientensuche
(optional)

Die Optionen für die angepasste Gradientensuche für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Suchentfernung und die maximale Suchentfernung in den Spalten an.

Value Table

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Koeffizienten-Raster-Layer

Die Ausgabe-Raster der Koeffizienten der erklärenden Variablen.

Raster
Ausgabe-Layer-Gruppe

Ein Gruppen-Layer der Ausgaben. Der Name des Gruppen-Layers ist der Wert des Parameters Ausgabe-Features mit dem Zusatz _MGWR_Results. Er enthält das standardisierte Residuum und einen separaten Untergruppen-Layer für jede erklärende Variable. Jeder Untergruppen-Layer enthält einen Koeffizienten-Layer und einen Signifikanz-Layer. Der Gruppen-Layer wird dem Bereich Inhalt hinzugefügt.

Group Layer

arcpy.stats.MGWR(in_features, dependent_variable, model_type, explanatory_variables, output_features, neighborhood_type, neighborhood_selection_method, {minimum_number_of_neighbors}, {maximum_number_of_neighbors}, {distance_unit}, {minimum_search_distance}, {maximum_search_distance}, {number_of_neighbors_increment}, {search_distance_increment}, {number_of_increments}, {number_of_neighbors}, {distance_band}, {number_of_neighbors_golden}, {number_of_neighbors_manual}, {number_of_neighbors_defined}, {distance_golden}, {distance_manual}, {distance_defined}, {prediction_locations}, {explanatory_variables_to_match}, {output_predicted_features}, {robust_prediction}, {local_weighting_scheme}, {output_table}, {coefficient_raster_workspace}, {scale}, {number_of_neighbors_gradient}, {distance_gradient})
NameErläuterungDatentyp
in_features

Die Feature-Class, die die abhängigen und erklärenden Variablen enthält.

Feature Layer
dependent_variable

Das numerische Feld mit den beobachteten Werten, die modelliert werden.

Field
model_type

Gibt das Regressionsmodell auf Basis der Werte der abhängigen Variablen an. Aktuell werden nur kontinuierliche Daten unterstützt, und der Parameter ist im Bereich Geoverarbeitung ausgeblendet. Verwenden Sie keine abhängigen kategorialen oder binären Variablen sowie keine abhängigen Variablen des Typs "Anzahl".

  • CONTINUOUSDie abhängige Variable stellt kontinuierliche Werte dar. Dies ist die Standardeinstellung.
String
explanatory_variables
[explanatory_variables,...]

Eine Liste der Felder, die als unabhängige erklärende Variablen im Regressionsmodell verwendet werden.

Field
output_features

Die neue Feature-Class, die die Koeffizienten, Residuen und Signifikanzniveaus des MGWR-Modells enthält.

Feature Class
neighborhood_type

Gibt an, ob die Nachbarschaft eine feste Entfernung ist oder abhängig von der Dichte der Features räumlich schwanken darf.

  • NUMBER_OF_NEIGHBORSDie Nachbarschaftsgröße ist eine angegebene Anzahl der nächsten Nachbarn für jedes Feature. Wo die Features dicht sind, ist die räumliche Ausdehnung der Nachbarschaft kleiner. Bei wenigen Features ist die räumliche Ausdehnung der Nachbarschaft größer.
  • DISTANCE_BANDDie Nachbarschaftsgröße ist eine konstante oder feste Entfernung für jedes Feature.
String
neighborhood_selection_method

Gibt an, wie die Nachbarschaftsgröße bestimmt wird.

  • GOLDEN_SEARCHEine optimale Entfernung oder optimale Anzahl der Nachbarn wird ermittelt, indem der AICc-Wert mithilfe des Golden-Search-Algorithmus minimiert wird. Bei dieser Option dauert die Berechnung am längsten, insbesondere bei großen oder hochdimensionalen Datasets.
  • GRADIENT_SEARCHEine optimale Entfernung oder optimale Anzahl der Nachbarn wird ermittelt, indem der AICc-Wert mithilfe des Gradienten-basierten Optimierungsalgorithmus minimiert wird. Diese Option wird am schnellsten ausgeführt und kommt im Vergleich zur Option "Golden Search" mit signifikant weniger Speicherauslastung aus.
  • MANUAL_INTERVALSEine Entfernung oder Anzahl der Nachbarn wird ermittelt, indem ein Wertebereich festgelegt und der Wert mit dem kleinsten AICc ausgewählt wird. Wenn der Parameter neighborhood_type auf DISTANCE_BAND festgelegt ist, wird der Minimalwert dieses Bereichs durch den Parameter minimum_search_distance angegeben. Der Minimalwert wird dann um den im Parameter search_distance_increment angegebenen Wert erhöht. Dieses Inkrement wird so viele Male wiederholt, wie im Parameter number_of_increments angegeben. Wenn der Parameter neighborhood_type auf NUMBER_OF_NEIGHBORS gesetzt ist, werden der Minimalwert, die Inkrementgröße und die Anzahl der Inkremente durch die Parameter minimum_number_of_neighbors, number_of_neighbors_increment bzw. number_of_increments angegeben.
  • USER_DEFINEDDie Nachbarschaftsgröße wird mit dem Parameterwert number_of_neighbors oder distance_band angegeben.
String
minimum_number_of_neighbors
(optional)

Die minimale Anzahl von Nachbarn, die jedes Feature in die Berechnungen einbezieht. Empfohlen wird, mindestens 30 Nachbarn zu verwenden.

Long
maximum_number_of_neighbors
(optional)

Die maximale Anzahl von Nachbarn, die jedes Feature in die Berechnungen einbezieht.

Long
distance_unit
(optional)

Gibt die Einheit für die Entfernung an, die zur Messung der Entfernungen zwischen Features verwendet wird.

  • FEETINTEntfernungen werden in internationalen Fuß gemessen.
  • MILESINTEntfernungen werden in Meilen gemessen.
  • FEETEntfernungen werden in US Survey-Fuß gemessen.
  • METERSEntfernungen werden in Metern gemessen.
  • KILOMETERSEntfernungen werden in Kilometern gemessen.
  • MILESEntfernungen werden in US Survey-Meilen gemessen.
String
minimum_search_distance
(optional)

Die minimale Suchentfernung, die auf alle erklärenden Variablen angewendet wird. Es wird empfohlen, eine minimale Entfernung anzugeben, die mindestens 30 Nachbarn für jedes Feature umfasst.

Double
maximum_search_distance
(optional)

Die maximale Suchentfernung, die auf alle Variablen angewendet wird.

Double
number_of_neighbors_increment
(optional)

Die Anzahl der Nachbarn, um die die manuellen Intervalle für jeden Nachbarschaftstest vergrößert werden.

Long
search_distance_increment
(optional)

Die Entfernung, um die die manuellen Intervalle für jeden Nachbarschaftstest vergrößert werden.

Double
number_of_increments
(optional)

Die Anzahl der zu testenden Nachbarschaftsgrößen bei der Verwendung manueller Intervalle. Die erste Nachbarschaftsgröße ist der Wert des Parameters minimum_number_of_neighbors oder minimum_search_distance.

Long
number_of_neighbors
(optional)

Die Anzahl der Nachbarn, die für den Nachbarschaftstyp "Benutzerdefiniert" verwendet werden.

Long
distance_band
(optional)

Die Größe des Entfernungsbands, das für den Nachbarschaftstyp "Benutzerdefiniert" verwendet wird. Alle Features innerhalb dieser Entfernung werden als Nachbarn in die lokalen Modelle aufgenommen.

Double
number_of_neighbors_golden
[number_of_neighbors_golden,...]
(optional)

Die angepassten Optionen für Golden Search für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Anzahl von Nachbarn und die maximale Anzahl von Nachbarn in den Spalten an.

Value Table
number_of_neighbors_manual
[number_of_neighbors_manual,...]
(optional)

Die Optionen für angepasste manuelle Intervalle für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die minimale Anzahl von Nachbarn, das Inkrement für die Anzahl der Nachbarn und die Anzahl der Inkremente in den Spalten an.

Value Table
number_of_neighbors_defined
[number_of_neighbors_defined,...]
(optional)

Die angepassten benutzerdefinierten Optionen für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Anzahl der Nachbarn an.

Value Table
distance_golden
[distance_golden,...]
(optional)

Die angepassten Optionen für Golden Search für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Suchentfernung und die maximale Suchentfernung in den Spalten an.

Value Table
distance_manual
[distance_manual,...]
(optional)

Die Optionen für angepasste manuelle Intervalle für einzelne erklärende Variablen. Geben Sie für jede anzupassende Variable die Variable, die minimale Suchentfernung, die Inkremente für die Suchentfernung und die Anzahl der Inkremente in den Spalten an.

Value Table
distance_defined
[distance_defined,...]
(optional)

Die angepassten benutzerdefinierten Optionen für einzelne erklärende Variablen. Geben Sie für jede anzupassende Variable die Variable und das Entfernungsband in den Spalten an.

Value Table
prediction_locations
(optional)

Eine Feature-Class mit den Positionen, an denen Schätzungen berechnet werden. Jedes Feature in diesem Dataset sollte einen Wert für alle angegebenen erklärenden Variablen enthalten. Die abhängige Variable für diese Features wird anhand des Modells geschätzt, das für die Eingabe-Feature-Class-Daten kalibriert wurde. Diese Feature-Positionen sollten sich innerhalb desselben Untersuchungsgebiets befinden wie die Eingabe-Features oder in dessen Nähe (innerhalb von 115 Prozent der Ausdehnung).

Feature Layer
explanatory_variables_to_match
[explanatory_variables_to_match,...]
(optional)

Die erklärenden Variablen der vorherzusagenden Positionen, die mit den entsprechenden erklärenden Variablen der Eingabe-Features übereinstimmen.

Value Table
output_predicted_features
(optional)

Die Ausgabe-Feature-Class zum Empfangen abhängiger Variablenschätzungen für jede vorherzusagende Position.

Feature Class
robust_prediction
(optional)

Gibt die Features an, die in den Vorhersageberechnungen verwendet werden.

  • ROBUSTFeatures, die mehr als drei Standardabweichungen vom Mittelwert abweichen (Wertausreißer), und Features mit der Gewichtung 0 (räumliche Ausreißer) werden aus den Vorhersageberechnungen ausgeschlossen, erhalten aber Vorhersagen in der Ausgabe-Feature-Class. Dies ist die Standardeinstellung.
  • NON_ROBUSTAlle Features werden in den Vorhersageberechnungen verwendet.
Boolean
local_weighting_scheme
(optional)

Gibt den Kernel-Typ an, mit dem die räumliche Gewichtung im Modell bereitgestellt wird. Der Kernel definiert, in welchem Zusammenhang die einzelnen Features mit anderen Features in ihrer Nachbarschaft stehen.

  • BISQUAREEinem Feature außerhalb der angegebenen Nachbarschaft wird die Gewichtung 0 zugewiesen. Dies ist die Standardeinstellung.
  • GAUSSIANAlle Features erhalten Gewichtungen, die Gewichtungen werden jedoch mit der Entfernung vom Ziel-Feature exponentiell kleiner.
String
output_table
(optional)

Eine Tabelle mit den Ausgabestatistiken des MGWR-Modells. Ein Balkendiagramm mit den geschätzten Bandbreiten oder der geschätzten Anzahl der Nachbarn wird in die Ausgabe aufgenommen.

Table
coefficient_raster_workspace
(optional)

Der Workspace, in dem Koeffizienten-Raster erstellt werden. Wenn dieser Workspace bereitgestellt wird, werden Raster für den Intercept und jede erklärende Variable erstellt. Dieser Parameter ist nur mit einer Desktop Advanced-Lizenz verfügbar. Wenn ein Verzeichnis angegeben wird, weisen die Raster den Raster-Typ TIFF (.tif) auf.

Workspace
scale
(optional)

Gibt an, ob die Werte der erklärenden und abhängigen Variablen vor dem Anpassen des Modells skaliert werden, sodass sie einen Mittelwert von null und eine Standardabweichung von eins aufweisen.

  • SCALE_DATADie Werte der Variablen werden skaliert. Die Ergebnisse enthalten skalierte und nicht skalierte Versionen der Koeffizienten von erklärenden Variablen.
  • NO_SCALE_DATADie Werte der Variablen werden nicht skaliert. Alle Koeffizienten liegen nicht skaliert und in den ursprünglichen Dateneinheiten vor.
Boolean
number_of_neighbors_gradient
[number_of_neighbors_gradient,...]
(optional)

Die Optionen für die angepasste Gradientensuche für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Anzahl von Nachbarn und die maximale Anzahl von Nachbarn in den Spalten an.

Value Table
distance_gradient
[distance_gradient,...]
(optional)

Die Optionen für die angepasste Gradientensuche für einzelne erklärende Variablen. Geben Sie für jede anzupassende erklärende Variable die Variable, die minimale Suchentfernung und die maximale Suchentfernung in den Spalten an.

Value Table

Abgeleitete Ausgabe

NameErläuterungDatentyp
coefficient_raster_layers

Die Ausgabe-Raster der Koeffizienten der erklärenden Variablen.

Raster
output_layer_group

Ein Gruppen-Layer der Ausgaben. Der Name des Gruppen-Layers ist der Wert des Parameters Ausgabe-Features mit dem Zusatz _MGWR_Results. Er enthält das standardisierte Residuum und einen separaten Untergruppen-Layer für jede erklärende Variable. Jeder Untergruppen-Layer enthält einen Koeffizienten-Layer und einen Signifikanz-Layer. Der Gruppen-Layer wird dem Bereich Inhalt hinzugefügt.

Group Layer

Codebeispiel

MGWR: Beispiel 1 (Python-Fenster)

Das folgende Skript im Python-Fenster veranschaulicht, wie Sie die Funktion MGWR verwenden.


import arcpy
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")
MGWR: Beispiel 2 (eigenständiges Skript)

Im folgenden eigenständigen Python-Skript wird veranschaulicht, wie Sie die Funktion MGWR verwenden.

# Run MGWR to predict house prices using "Number of Neighbors" and "Golden Search"
# Import modules
import arcpy

# Set the current workspace
arcpy.env.workspace = "C:/data"

# Run MGWR 
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")