Erklärende Variablen für räumliche Komponenten erstellen (Spatial Statistics)—ArcGIS AllSource

Zusammenfassung

Erstellt verschiedene Felder für räumliche Komponenten, die die räumlichen Muster von einem oder mehreren numerischen Feldern am besten beschreiben und als nützliche erklärende Variablen in einer Vorhersage oder einem Regressionsmodell dienen.

Bei den Eingabefeldern sollte es sich um die erklärenden und abhängigen Variablen handeln, die in einem Vorhersagemodell verwendet werden. Die Ergebnisfelder für räumliche Komponenten (sogenannte Moran-Eigenvektoren) können – zusätzlich zu den ursprünglichen erklärenden Variablen – als erklärende Variablen dienen und bewirken oft eine Verbesserung der Vorhersagekraft des Modells, da räumliche Muster der anderen Variablen einbezogen werden.

Weitere Informationen zu Moran-Eigenvektoren

Abbildung

Verwendung

Das Werkzeug erstellt räumliche Komponenten, die die Werte der Eingabefelder am genauesten vorhersagen können. Jede Komponente stellt ein räumliches Muster dar, und es werden die Komponenten ausgewählt, deren Muster den Mustern der Eingabefelder am meisten ähneln. Wenn ein Feld beispielsweise einen deutlichen Trend von Westen nach Osten aufweist, darüber hinaus jedoch auch kleine Cluster mit niedrigen und hohen Werten enthält, kann das Muster durch die Kombination von zwei Komponenten dargestellt werden: eine für den Trend von Westen nach Osten und eine andere für die Cluster. Durch das Einbeziehen erklärender Variablen, die den räumlichen Mustern der erklärenden und abhängigen Variablen ähneln, werden räumliche Effekte in Vorhersage- und Regressionswerkzeugen berücksichtigt, z. B. in den Werkzeugen Generalisierte lineare Regression und Forest-basierte und geboostete Klassifizierung und Regression. Aufgrund der Berücksichtigung räumlicher Effekte sind die Vorhersagen dieser nichträumlichen Vorhersagemodelle normalerweise genauer, und die räumliche Verzerrung (z. B. räumliche Muster in den Residuen) ist oft geringer. Dies ist wichtig, damit für bestimmte Bereiche nicht systematisch kleinere oder größere Werte vom Modell vorhergesagt werden. Darüber hinaus können die Koeffizienten der erklärenden Variablen einfacher interpretiert werden, da sie die direkte Beziehung zwischen der erklärenden Variable und der abhängigen Variable schätzen und dabei durch räumliche Effekte verursachtes Rauschen ausfiltern.
Dieses Werkzeug ist für die Erstellung erklärender Variablen zur Verwendung in Vorhersagemodellen vorgesehen. Das Werkzeug Räumliche Autokorrelation aus Feld filtern eignet sich jedoch ebenfalls für diesen Zweck, indem die räumliche Autokorrelation aus dem Feld "Residuum" oder "Standardisiertes Residuum" eines Vorhersagemodells entfernt wird. Die räumlichen Komponenten, mit denen die Autokorrelation von Residuen effektiv ausgefiltert wird, stellen häufig nützliche erklärende Variablen dar und können oft eine gleichwertige Modellverbesserung für dieses Werkzeug mit weniger Komponenten als erklärenden Variablen erzielen. Es empfiehlt sich, beide Werkzeuge zu testen und die Ergebnisse zu vergleichen, die sich durch das Einbeziehen räumlicher Komponenten aus den beiden Werkzeugen im ursprünglichen Vorhersagemodell ergeben (z. B. durch den Vergleich der Adjusted R-Squared- oder AIC-Werte).
Die räumlichen Komponenten werden als Felder in der Ausgabe-Feature-Class zurückgegeben. Bei Ausführung des Werkzeugs in einer aktiven Karte wird der Ausgabe-Feature-Layer basierend auf der ersten räumlichen Komponente gezeichnet. Die Eingabefelder werden auch in die Ausgabe-Feature-Class einbezogen, sodass die ursprünglichen erklärenden Variablen und die erklärenden Variablen der räumlichen Komponente verwendet werden können, um die abhängige Variable in Vorhersagewerkzeugen vorherzusagen, ohne die Eingabe- und Ausgabe-Feature-Classes zusammenführen zu müssen.
Die Geoverarbeitungsmeldungen enthalten die folgenden Tabellen, in denen die Auswahl der räumlichen Komponenten zusammengefasst ist, die zum räumlichen Filtern des Eingabefeldes verwendet wird:
- Suchverlauf für Nachbarschaften: Für jede der getesteten räumlichen Gewichtungsmatrizen (SWMs) werden Details der SWM (wie die Anzahl der Nachbarn und das Gewichtungsschema), der p-Wert und Adjusted R-Squared-Wert bei Verwendung aller Komponenten, der Adjusted R-Squared-Wert bei Verwendung nur der ausgewählten Komponenten und die Anzahl der ausgewählten Komponenten angezeigt. Die SWM mit dem höchsten Adjusted R-Squared-Wert bei Verwendung der ausgewählten Komponenten wird zum Erstellen der Komponenten verwendet und durch fett formatierten Text und ein Sternchen gekennzeichnet.
- Suchverlauf für räumliche Komponenten: Für die ausgewählte SWM werden der ID-Wert der einzelnen Komponenten (ID 4 steht beispielsweise für die vierte räumliche Komponente), der Morans I-Wert und p-Wert der Komponente und der Adjusted R-Squared-Wert der Komponente (einschließlich aller zuvor ausgewählten Komponenten) angezeigt. Die Zeilen sind nach den Komponenten, mit denen die Eingabefelder am effektivsten unabhängig vorhergesagt wurden (höchster R-Squared-Wert), geordnet.
Um die zum Erstellen der räumlichen Komponenten zu verwendende SWM auszuwählen, generiert das Werkzeug eine Liste mit SWM-Kandidaten und testet, welche SWM räumliche Komponenten erstellt, von denen die Werte der Eingabefelder am genauesten vorhergesagt werden. Wenn im Parameter Eingabe-Dateien der räumlichen Gewichtungsmatrix keine SWM-Dateien angegeben sind, werden 28 SWMs erstellt und in die Kandidatenliste aufgenommen (Beschreibungen der einzelnen SWMs finden Sie unter Moran-Eigenvektoren). Wenn Eingabe-SWMs angegeben sind, können Sie mithilfe des Parameters Nur räumliche Eingabe-Gewichtungsmatrizen vergleichen angeben, ob die Kandidatenliste nur die angegebenen SWMs oder die angegebenen SWMs und die 28 vom Werkzeug erstellten SWMs enthält. Um beispielsweise eine einzelne angegebene SWM zu verwenden, geben Sie im Parameter Eingabe-Dateien der räumlichen Gewichtungsmatrix die SWM an, und lassen Sie den Parameter Nur räumliche Eingabe-Gewichtungsmatrizen vergleichen aktiviert.
Das Werkzeug trifft auf folgende Weise eine Auswahl unter den SWM-Kandidaten:
1. Die SWM aller 28 SWM-Kandidaten wird auf statistische Signifikanz getestet, indem mit allen räumlichen Komponenten als erklärenden Variablen statistisch signifikante Vorhersagen für die Eingabefelder getroffen werden. Für den Signifikanztest wird der kombinierte R-Squared-Wert aus allen Eingabefeldern verwendet und eine Šidák-Korrektur des p-Wertes durchgeführt, um die Anzahl der getesteten SWMs zu berücksichtigen. SWMs, die statistisch nicht signifikant sind, werden von der Kandidatenliste entfernt.
2. Für jeden verbleibenden SWM-Kandidaten werden räumliche Komponenten sequenziell als erklärende Variablen hinzugefügt, bis die nächste Komponente nicht für sich allein genommen statistisch signifikant ist (p-Wert größer als 0,05) oder der Adjusted-R-Squared-Wert der Komponente (und aller zuvor ausgewählten Komponenten) den Adjusted-R-Squared-Wert bei Verwendung aller Komponenten der SWM überschreitet. Jede neue Komponente wird ausgewählt, indem nach derjenigen mit der höchsten statistischen Signifikanz (niedrigster p-Wert) bei Verwendung zur Vorhersage der Eingabefelder gesucht wird.
3. Die SWM mit dem höchsten Adjusted-R-Squared-Wert wird als SWM-Endergebnis ausgewählt, und die zugehörigen ausgewählten räumlichen Komponenten werden als Felder in der Ausgabe-Feature-Class zurückgegeben.
Dieses Verfahren wird als FWD-Auswahlmethode (Vorwärtsgerichtete Auswahl) bezeichnet und wird in der folgenden Quelle ausführlich beschrieben:
- Blanchet, F. Guillaume, Pierre Legendre und Daniel Borcard. 2008. "Forward selection of explanatory variables." Ecology 89, no. 9: 2623-2632. https://doi.org/10.1890/07-0986.1.
.

Parameter

Beschriftung	Erläuterung	Datentyp
Eingabe-Features	Die Eingabe-Features mit Feldern für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Feature Layer
Eingabefelder	Die Eingabefelder für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Field
Ausgabe-Features	Die Ausgabe-Features mit den Feldern der räumlichen Komponenten, die als zusätzliche erklärende Variablen in einem Vorhersagemodell verwendet werden können.	Feature Class
Alle Felder aus Eingabe-Features anhängen (optional)	Gibt an, ob alle Felder aus den Eingabe-Features in die Ausgabe-Feature-Class kopiert werden. Aktiviert: Alle Felder der Eingabe-Features werden in die Ausgabe-Feature-Class kopiert. Dies ist die Standardeinstellung. Deaktiviert: Nur die Eingabefelder werden in die Ausgabe-Feature-Class kopiert.	Boolean
Eingabe-Dateien der räumlichen Gewichtungsmatrix (optional)	Eine Liste der Eingabe-SWM-Dateien (.swm), die als Kandidaten für die SWM verwendet werden, mit der die erklärenden Variablen für räumliche Komponenten erstellt werden. Wenn keine Dateien angegeben werden, testet das Werkzeug 28 verschiedene Nachbarschaften.	File
Ausgabe-Datei der räumlichen Gewichtungsmatrix (optional)	Die Ausgabe-SWM-Datei (.swm) der Nachbarn und Gewichtungen, die vom Werkzeug ausgewählt wurden. Dieser Parameter wird nicht angewendet, wenn Sie eine Eingabe-.swm-Datei angeben.	File
Eindeutiges ID-Feld (optional)	Das Feld für die eindeutige ID der Ausgabe-.swm-Datei. Das Feld muss für jedes Eingabe-Feature einen Einzelwert in Form einer ganzen Zahl enthalten.	Field
Nur räumliche Eingabe-Gewichtungsmatrizen vergleichen (optional)	Gibt an, ob nur die im Parameter Eingabe-Dateien der räumlichen Gewichtungsmatrix angegebenen .swm-Dateien oder 28 zusätzliche Nachbarschaften getestet werden. Das Werkzeug verwendet die SWM, die räumliche Komponenten erstellt, mit denen die Werte der Eingabefelder am genauesten vorhergesagt werden. Dieser Parameter wird nur angewendet, wenn mindestens eine Eingabe-SWM angegeben wird. Aktiviert: Nur die im Parameter Eingabe-Dateien der räumlichen Gewichtungsmatrix angegebenen Eingabe-SWMs werden getestet. Dies ist die Standardeinstellung. Deaktiviert: Die im Parameter Eingabe-Dateien der räumlichen Gewichtungsmatrix angegebenen Eingabe-SWMs und 28 zusätzliche Nachbarschaften werden getestet.	Boolean

arcpy.stats.CreateSpatialComponentExplanatoryVariables(in_features, input_fields, out_features, {append_all_fields}, {in_swm}, {out_swm}, {id_field}, {compare_only_inputs})

Name	Erläuterung	Datentyp
in_features	Die Eingabe-Features mit Feldern für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Feature Layer
input_fields [input_fields,...]	Die Eingabefelder für die erklärenden und abhängigen Variablen, die in einem Vorhersagemodell verwendet werden.	Field
out_features	Die Ausgabe-Features mit den Feldern der räumlichen Komponenten, die als zusätzliche erklärende Variablen in einem Vorhersagemodell verwendet werden können.	Feature Class
append_all_fields (optional)	Gibt an, ob alle Felder aus den Eingabe-Features in die Ausgabe-Feature-Class kopiert werden. ALL—Alle Felder der Eingabe-Features werden in die Ausgabe-Feature-Class kopiert. Dies ist die Standardeinstellung. NO_FIELDS—Nur die Eingabefelder werden in die Ausgabe-Feature-Class kopiert.	Boolean
in_swm [in_swm,...] (optional)	Eine Liste der Eingabe-SWM-Dateien (.swm), die als Kandidaten für die SWM verwendet werden, mit der die erklärenden Variablen für räumliche Komponenten erstellt werden. Wenn keine Dateien angegeben werden, testet das Werkzeug 28 verschiedene Nachbarschaften.	File
out_swm (optional)	Die Ausgabe-SWM-Datei (.swm) der Nachbarn und Gewichtungen, die vom Werkzeug ausgewählt wurden. Dieser Parameter wird nicht angewendet, wenn Sie eine Eingabe-.swm-Datei angeben.	File
id_field (optional)	Das Feld für die eindeutige ID der Ausgabe-.swm-Datei. Das Feld muss für jedes Eingabe-Feature einen Einzelwert in Form einer ganzen Zahl enthalten.	Field
compare_only_inputs (optional)	Gibt an, ob nur die im Parameter in_swm angegebenen .swm-Dateien oder außerdem 28 zusätzliche Nachbarschaften getestet werden. Das Werkzeug verwendet die SWM, die räumliche Komponenten erstellt, mit denen die Werte der Eingabefelder am genauesten vorhergesagt werden. Dieser Parameter wird nur angewendet, wenn mindestens eine Eingabe-SWM angegeben wird. COMPARE_INPUTS—Nur die im Parameter in_swm angegebenen .swm-Eingabedateien werden getestet. Dies ist die Standardeinstellung. COMPARE_ALL—Die im Parameter in_swm angegebenen .swm-Eingabedateien und 28 zusätzliche Nachbarschaften werden getestet.	Boolean

Codebeispiel

CreateSpatialComponentExplanatoryVariables: Beispiel 1 (Python-Fenster)

Das folgende Skript im Python-Fenster veranschaulicht, wie Sie die Funktion CreateSpatialComponentExplanatoryVariables verwenden.

# Create fields that describe the spatial patterns of POPULATION.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="states",
    input_fields="POPULATION",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

CreateSpatialComponentExplanatoryVariables: Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Skript veranschaulicht, wie die Funktion CreateSpatialComponentExplanatoryVariables verwendet wird.

# Create fields that describe the spatial patterns of two analysis fields.

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CreateSpatialComponentExplanatoryVariables(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_features=r"myOutputFeatureClass",
    append_all_fields="ALL",
    in_swm=None,
    out_swm=None,
    id_field=None
)

# Print the messages. 
print(arcpy.GetMessages())

Umgebungen

Geographische Transformationen, Ausgabe-Koordinatensystem, Faktor für parallele Verarbeitung, Zufallszahlengenerator