Das GWR-Werkzeug erstellt eine separate Gleichung für jedes Feature im Dataset, wobei die abhängigen und erklärenden Variablen von Features, die in die Bandbreite der einzelnen Ziel-Features fallen, einbezogen werden. Shape und Ausdehnung der Bandbreite hängen von den Benutzereingaben für die Parameter Kernel-Typ, Bandbreitenmethode, Entfernung und Anzahl der Nachbarn ab. Dabei gilt jedoch folgende Einschränkung: Wenn die Anzahl der benachbarten Features 1000 überschreitet, werden nur die nächsten 1000 in jede lokale Gleichung aufgenommen.
Wenden Sie das GWR-Werkzeug auf Datasets mit mehreren hundert Features an, um optimale Ergebnisse zu erzielen. Für kleine Datasets ist diese Methode nicht geeignet. Das Werkzeug funktioniert nicht mit Multipoint-Daten.
Das GWR-Werkzeug erzeugt verschiedene Ausgaben. Während der Ausführung des Werkzeugs wird unten im Bereich Geoverarbeitung eine Zusammenfassung des GWR-Modells in Form von Meldungen angezeigt. Sie können auf diese Meldungen zugreifen, indem Sie mit der Maus auf die Fortschrittsleiste zeigen, auf die Pop-out-Schaltfläche klicken oder den Abschnitt "Meldungen" im Bereich Geoverarbeitung erweitern. Sie können auch über den Geoverarbeitungsverlauf auf die Meldungen einer früheren Ausführung des Werkzeugs Geographisch gewichtete Regression zugreifen.
Das GWR-Werkzeug erzeugt auch eine Ausgabe-Feature-Class und eine Tabelle mit den Diagnosewerten des Zusammenfassungsberichts. Der Name dieser Tabelle wird automatisch erstellt und setzt sich aus dem Namen der Ausgabe-Feature-Class und dem Suffix _supp zusammen. Die Ausgabe-Feature-Class wird automatisch dem Inhaltsverzeichnis hinzugefügt, wobei ein Hot/Cold-Rendering-Schema zur Modellierung von Residuen angewendet wird.Die _supp-Datei wird immer im selben Verzeichnis erstellt wie die Ausgabe-Feature-Class, es sei denn, die Ausgabe-Feature-Class wird in einem Feature-Dataset erstellt. Wenn sich die Ausgabe-Feature-Class in einem Feature-Dataset befindet, wird die Tabelle _supp in der Geodatabase erstellt, die das Feature-Dataset enthält.
Es wird empfohlen, projizierte Daten zu verwenden. Dies ist besonders wichtig, wenn die Entfernung eine Komponente der Analyse ist, z. B. wenn Sie für GWR Fest als Kernel-Typ auswählen. Es wird empfohlen, dass die Daten in einem projizierten Koordinatensystem (und nicht in einem geographischen Koordinatensystem) vorliegen.
Zur Verbesserung der Performance werden für einen Teil der vom GWR-Werkzeug ausgeführten Berechnungen mehrere CPUs verwendet. Zur Verarbeitung werden automatisch bis zu acht Threads/CPUs genutzt.
Die Regressionsanalyse muss immer mit der OLS-Regression (Kleinste Quadrate (Ordinary Least Squares)) beginnen. Suchen Sie zunächst ein korrekt spezifiziertes OLS-Modell. Führen Sie dann das GWR-Werkzeug mit denselben erklärenden Variablen aus (ohne Dummy-Variablen, die als Indikator für andere räumliche Ordnungen dienen).
Abhängige und erklärende Variablen müssen Zahlenfelder sein, die eine Vielzahl von Werten enthalten. Lineare Regressionsmethoden wie GWR sind nicht für das Vorhersagen von binären Ergebnissen geeignet (wenn z. B. alle Werte für die abhängige Variable entweder 1 oder 0 betragen).
In globalen Regressionsmodellen wie Kleinste Quadrate (Ordinary Least Squares, OLS) sind die Ergebnisse unzuverlässig, wenn zwei oder mehr Variablen Multikollinearität aufweisen (wenn zwei oder mehr Variablen redundant sind oder das Gleiche aussagen). GWR erstellt eine lokale Regressionsgleichung für jedes Feature im Dataset. Wenn die Werte für eine bestimmte erklärende Variable zur räumlichen Cluster-Bildung neigen, liegen wahrscheinlich Probleme mit lokaler Multikollinearität vor. Das Bedingungswert-Feld (COND) in der Ausgabe-Feature-Class gibt an, wann Ergebnisse aufgrund von lokaler Multikollinearität instabil sind. Betrachten Sie im Allgemeinen Ergebnisse für Features mit einem Bedingungswert größer als 30, gleich null oder (für Shapefiles) gleich -1.7976931348623158e+308 skeptisch.
Bei Verwendung von Nominal- oder Kategoriedaten in einem GWR-Modell ist Vorsicht angebracht. Wenn Kategorien zur Bildung von räumlichen Clustern neigen, treten u. U. Probleme aufgrund von lokaler Multikollinearität auf. Der in der Ausgabe des GWR-Werkzeugs enthaltene Bedingungswert gibt an, wann lokale Kollinearität ein Problem darstellt (ein Bedingungswert kleiner als null (0), größer als 30 oder gleich NULL). Bei einer starken lokalen Multikollinearität sind die Ergebnisse instabil.
Verwenden Sie keine künstlichen Variablen zur Darstellung anderer räumlicher Ordnungen in einem GWR-Modell (z. B. Zuweisung des Wertes 1 zu Zählbezirken außerhalb des Stadtkerns und des Wertes 0 zu allen anderen). Da die erklärenden Variablenkoeffizienten bei der geographisch gewichteten Regression variieren können, sind diese erklärenden Variablen für räumliche Ordnungen unnötig und können Probleme aufgrund von lokaler Multikollinearität verursachen.
Um die regionale Variation unter den Koeffizienten der erklärenden Variablen besser zu verstehen, untersuchen Sie die vom GWR-Werkzeug erstellten optionalen Koeffizienten-Raster-Oberflächen. Diese Raster-Oberflächen werden im Koeffizienten-Raster-Workspace erstellt. Für Polygondaten können Sie auf jedes Koeffizientenfeld in der Ausgabe-Feature-Class Cold-to-Hot-Rendering oder Rendering mit abgestuften Farben verwenden, um die Änderungen in Ihrem Untersuchungsgebiet zu untersuchen.
Sie können das GWR-Werkzeug auch für Vorhersagen verwenden, indem Sie eine Feature-Class für vorherzusagende Positionen (stimmt meist mit der Eingabe-Feature-Class überein), die erklärenden Variablen für die Vorhersage und eine Ausgabe-Prediction-Feature-Class angeben. Es muss eine 1:1-Entsprechung zwischen den für die Kalibrierung des Regressionsmodells verwendeten Feldern (die für das Feld Erklärende Variablen eingegebenen Werte) und den für die Vorhersage verwendeten Feldern (die für das Feld Erklärende Variablen für die Vorhersage eingegebenen Werte) bestehen. Die Reihenfolge dieser Variablen muss übereinstimmen. Angenommen, Sie modellieren z. B. Verkehrsunfälle als Funktion von Geschwindigkeitsbegrenzungen, Straßenbeschaffenheit, Anzahl von Fahrbahnen und Anzahl von Autos. Sie können die Auswirkungen einer Änderung der Geschwindigkeitsbegrenzungen oder einer Straßenausbesserung auf die Verkehrsunfälle vorhersagen, indem Sie neue Variablen mit den geänderten Geschwindigkeitsbegrenzungen und der geänderten Straßenbeschaffenheit erstellen. Die vorhandenen Variablen werden zur Kalibrierung des Regressionsmodells und für den Parameter Erklärende Variablen verwendet. Die geänderten Variablen werden für Vorhersagen verwendet und als erklärende Variablen für die Vorhersage eingegeben.
Wenn Sie zwar eine Prediction-Locations-Feature-Class, aber keine erklärenden Variablen für die Vorhersage angeben, enthält die Ausgabe-Prediction-Feature-Class lediglich die für jede Position berechneten Koeffizienten (keine Vorhersagen).
Bei einem falsch angegebenen Regressionsmodell handelt es sich um ein Modell, in dem eine wichtige erklärende Variable fehlt. Die statistisch signifikante räumliche Autokorrelation in den Regressionsresiduen oder die unerwartete räumliche Variation unter den Koeffizienten einer oder mehrerer erklärender Variablen weist darauf hin, dass das Modell falsch angegeben ist. Ermitteln Sie mit allen verfügbaren Analysemethoden (zum Beispiel die Untersuchung von OLS-Residuen und GWR-Koeffizientenvariationen) welche wichtigen Variablen fehlen, damit sie in das Modell aufgenommen werden können.
Hinterfragen Sie stets, ob es sinnvoll ist, dass eine erklärende Variable nicht stationär ist. Nehmen Sie beispielsweise an, Sie modellieren die Verbreitung einer bestimmten Pflanzenart als Funktion mehrerer Variablen einschließlich ASPECT. Wenn Sie feststellen, dass sich der Koeffizient für die Variable ASPECT über das Untersuchungsgebiet hinweg ändert, weist dies darauf hin, dass eine wichtige erklärende Variable fehlt (zum Beispiel die Verbreitung einer konkurrierenden Vegetationsart). Treffen Sie alle möglichen Maßnahmen, damit alle wichtigen erklärenden Variablen in Ihrem Regressionsmodell enthalten sind.
Vorsicht:
Denken Sie beim Verwenden von Shapefiles daran, dass diese keine NULL-Werte speichern können. Werkzeuge oder andere Verfahren zur Erstellung von Shapefiles aus Nicht-Shapefile-Eingaben speichern NULL-Werte ggf. als Wert 0 oder als sehr kleinen negativen Wert (-DBL_MAX = -1,7976931348623158e+308). Dies kann zu unerwarteten Ergebnissen führen. Weitere Informationen finden Sie unter Überlegungen zur Geoverarbeitung für die Shapefile-Ausgabe.
Wenn das Ergebnis einer Berechnung unendlich oder nicht definiert ist, lautet das Ergebnis für Nicht-Shapefiles NULL und für Shapefiles -DBL_MAX = -1.7976931348623158e+308.
Wenn Sie Akaike Information Criterion oder Cross Validation als Bandbreitenmethode auswählen, sucht GWR die optimale Entfernung (für einen festen Kernel) bzw. die optimale Anzahl der Nachbarn (für einen adaptiven Kernel). Durch Probleme mit lokaler Multikollinearität wird jedoch verhindert, dass mit den Bandbreitenmethoden Akaike Information Criterion und Cross Validation die optimale Entfernung bzw. die optimale Anzahl von Nachbarn berechnet wird. Wenn ein Fehler auf schwerwiegende Probleme beim Modellentwurf hinweist, versuchen Sie, eine bestimmte Entfernung oder Anzahl von Nachbarn anzugeben. Untersuchen Sie dann die Bedingungswerte in der Ausgabe-Feature-Class, um zu ermitteln, welche Features mit den Problemen mit lokaler Multikollinearität verknüpft sind.
Schwerwiegende Fehler beim Modellentwurf oder Fehler mit der Meldung, dass die Anzahl an Nachbarn in lokalen Gleichungen nicht ausreicht, weisen oft auf globale oder lokale Multikollinearität hin. Um die Problemursache zu ermitteln, führen Sie das Modell mit OLS aus, und untersuchen Sie den VIF-Wert für jede erklärende Variable. Wenn einige der VIF-Werte sehr groß sind (z. B. größer als 7,5), verhindert die globale Multikollinearität die Berechnung mit dem GWR-Werkzeug. Jedoch ist wahrscheinlich eher eine lokale Multikollinearität das Hauptproblem. Versuchen Sie, eine thematische Karte für jede erklärende Variable zu erstellen. Wenn die Karte räumliche Cluster-Bildung von identischen Werten erkennen lässt, entfernen Sie diese Variablen aus dem Modell oder kombinieren Sie diese Variablen mit anderen erklärenden Variablen, um die Wertvariation zu erhöhen. Wenn Sie beispielsweise Immobilienwerte modellieren und für Schlafzimmer wie auch Badezimmer über Variablen verfügen, ist es möglicherweise sinnvoll, diese zu kombinieren, um die Wertvariation zu erhöhen oder sie als kombinierte Größe darzustellen. Vermeiden Sie beim Erstellen von GWR-Modellen die Verwendung der folgenden Variablen: Dummy-Variablen für räumliche Ordnungen, Kategorievariablen bzw. nominale Variablen für räumliche Cluster-Bildung oder Variablen mit sehr wenigen möglichen Werten.
Bei der geographisch gewichteten Regression handelt es sich um ein lineares Modell, für das die gleichen Anforderungen gelten wie für das OLS-Modell. Stellen Sie anhand des Abschnitts Wie Regressionsmodelle ungültig werden des Dokuments Grundlagen zur Regressionsanalyse sicher, dass Ihr GWR-Modell ordnungsgemäß angegeben ist.