Mit Modelldatei für räumliche Statistiken vorhersagen (Spatial Statistics)

Zusammenfassung

Sagt kontinuierliche oder kategorische Werte mithilfe einer trainierten Modelldatei für räumliche Statistiken (.ssm-Datei) vorher.

Weitere Informationen zu Modelldateien für räumliche Statistiken

Verwendung

  • Nachfolgend finden Sie Beispielszenarien für die Verwendung dieses Werkzeugs:

    • Für ein Forest-basiertes Klassifizierungs- und Regressionsmodell, das unter Verwendung einer Reihe von erklärenden Umgebungsvariablen, die sowohl als Attribute als auch als Raster dargestellt werden, zum Vorkommen von Seegras und den Entfernungen zu flussaufwärts liegenden Fabriken und großen Häfen trainiert wird, kann das künftige Vorkommen von Seegras auf der Grundlage von Prognosen für diese erklärenden Umgebungsvariablen vorhergesagt werden.
    • Ein Modell, das durch einen Experten trainiert wurde, kann für andere Benutzer freigegeben werden, um Vorhersagen zu treffen, ohne dass sensible Daten freigegeben werden. Beispiel: Mit einem Modell über die Bleiwerte im Blut von Kindern und die Steuerflurstücks-ID der jeweiligen Häuser kann in Verbindung mit Attributen auf Flurstückebene wie dem Alter des Hauses, offiziellen Bevölkerungsdaten wie Einkommens- und Bildungsniveau und nationalen Datasets, die die toxische Freisetzung von Blei und Bleiverbindungen wiedergeben, das Risiko einer Bleiexposition für Parzellen ohne Daten zu Blutbleiwerten vorhergesagt werden. Diese Risikovorhersagen können für Maßnahmen und Aufklärungsprogramme in dem Gebiet genutzt werden.
    • Eine Ökologin hat Felddaten zu beobachteten Positionen des Vorhandenseins einer bedrohten Art gesammelt. Sie muss das Vorhandensein der Art in einem größeren Untersuchungsgebiet schätzen und ihre Arbeit für andere Forscher freigeben. Anhand der bekannten Positionen des Vorhandenseins und mithilfe zugrunde liegender Faktoren als Raster kann die Ökologin unter Verwendung der auf Vorhandensein beschränkten Vorhersage das Vorhandensein der Art modellieren und das trainierte Modell freigeben, ohne dass sensible Daten zum Vorhandensein der Art freigegeben werden. Das Modell kann verwendet werden, um eine Karte vorhergesagter Positionen, an denen die Art mit der größten Wahrscheinlichkeit vorhanden ist, zu erstellen.

  • Der Wert des Parameters Eingabe-Modelldatei ist eine .ssm-Datei, die mit mehreren Werkzeugen im Toolset Modellierung von räumlichen Beziehungen der Toolbox "Spatial Statistics" erstellt werden kann. Sie können die Modelldatei mit den Werkzeugen Generalisierte lineare Regression, Forest-basierte und geboostete Klassifizierung und Regression und Auf Vorhandensein beschränkte Vorhersage (MaxEnt) erstellen, indem Sie im jeweiligen Werkzeug den Parameterwert Trainierte Ausgabe-Modelldatei angeben.

    Unter Funktionsweise des Werkzeugs "Generalisierte lineare Regression", Funktionsweise des Werkzeugs "Forest-basierte und geboostete Klassifizierung und Regression" und Funktionsweise des Werkzeugs "Auf Vorhandensein beschränkte Vorhersage (MaxEnt)" erfahren Sie, wie bei den einzelnen Modellen Vorhersagen für jeden Modelltyp getroffen werden.

  • Wenn die Option Features vorhersagen des Parameters Vorhersagetyp verwendet wird, dann verwenden Sie den Parameter Vorhergesagte Ausgabe-Features, um eine Feature-Class mit den Vorhersagen zu erstellen. Wenn die Option Raster vorhersagen verwendet wird, dann verwenden Sie den Parameter Vorhergesagte Ausgabe-Oberfläche, um ein Raster der vorhergesagten Werte zu erstellen.

  • Um Raster vorherzusagen, muss die .ssm-Datei ausschließlich mit Rastern trainiert werden.

  • Zur Verwendung einer .ssm-Datei, die mit Rastern trainiert wurde, ist eine Erweiterung "ArcGIS Spatial Analyst"-Lizenz erforderlich.

    Hinweis:

    Bevor Sie dieses Werkzeug ausführen, sollten Sie das Werkzeug Modelldatei für räumliche Statistiken beschreiben ausführen, um etwas über die Namen, Typen, Beschreibungen und Einheiten der Variablen zu erfahren, damit die Daten entsprechend vorbereitet werden können. Sie können auch die Modelldiagnosen verwenden, um die Qualität der Eingabe-Modelldatei zu bewerten.

  • Erklärende Variablen können aus Feldern stammen, aus Entfernungs-Features berechnet oder aus Rastern extrahiert werden. Die Kombination der erklärenden Variablen sollte mit der Eingabe-Modelldatei übereinstimmen.

  • Wenn beim Erstellen der Modelldatei eine erklärende Variable oder ein erklärendes Raster als kategorisch markiert ist, dann wird der Parameter Kategorisch überprüft und die übereinstimmende Variable als kategorisch behandelt. Bevor Sie dieses Werkzeug ausführen, können Sie das Werkzeug Modelldatei für räumliche Statistiken beschreiben verwenden, um zu bestimmen, welche Variablen in der Modelldatei kategorische Variablen sind.

  • Die Trainings- und Vorhersagevariablen sollten Felder eines ähnlichen Typs sein. Beispiel: Alle numerischen Feldtypen können mit allen anderen numerischen Feldtypen abgeglichen werden. Wenn das Trainingsfeld jedoch ein Textfeld ist, dann sollte auch die entsprechende Vorhersagevariable eine Textvariable sein.

    Hinweis:

    Es wird empfohlen, dass Sie die Variableneinheiten festlegen, bevor die Trainings- und die Vorhersagevariablen abgeglichen werden. Wenn in der trainierten Modelldatei und in der Vorhersage unterschiedliche Variableneinheiten verwendet werden, dann können die Ergebnisse falsch sein. Wenn Sie zum Beispiel ein Modell mit einer Einkommensvariablen in US-Dollar trainieren, beim Treffen von Vorhersagen diese Variable aber mit einem Einkommen in Indischen Rupien abgleichen, dann erhalten Sie ungenau vorhergesagte Variablen, da die Variablenbereiche zwischen den trainierten Variablen und den Vorhersagevariablen inkonsistent sein können.

  • Dieses Werkzeug erstellt auch Meldungen und Diagramme, mit denen die Performance des Modells beschrieben wird. Um auf die Meldungen zuzugreifen, zeigen Sie mit der Maus auf die Fortschrittsleiste, und klicken Sie auf die Pop-out-Schaltfläche, oder erweitern Sie den Abschnitt "Meldungen" im Bereich Geoverarbeitung. Sie können auch auf die Meldungen für eine vorherige Ausführung des Werkzeugs über den Geoverarbeitungsverlauf zugreifen. Die Meldungen enthalten Modelldiagnosen und weitere Informationen über das Modell.

  • Die Tabelle Modellparameter in den Geoverarbeitungsmeldungen enthält die Beschreibungen der vorherzusagenden Variable und des Feldtyps sowie der erklärenden Variablen, die zum Erstellen des Modells verwendet wurden. Diese Tabelle enthält auch für jede Variable die Einheiten (die mit dem Werkzeug Eigenschaften der Modelldatei für räumliche Statistiken festlegen festgelegt wurden), damit sichergestellt werden kann, dass sie auf die Vorhersagevariablen abgestimmt sind, wenn das Modell verwendet wird, um Vorhersagen zu treffen.

    Vorsicht:

    Bevor Sie den Vorhersageergebnissen vertrauen, sollten Sie die Modelldiagnose bewerten. Wenn ein Modell trainiert wurde, ohne dass Validierungsdaten zurückgehalten wurden, kann die Genauigkeit der Vorhersagen nicht bewertet werden.

    Vorsicht:

    Wenn das Werkzeug mit ArcPy ausgeführt wird, dann sind die Reihenfolge und die Groß-/Kleinschreibung der Variablen in den Wertetabellen der Parameter Erklärende Variablen abgleichen, Entfernungs-Features abgleichen und Erklärende Raster abgleichen wichtig. Wenn Sie zum Beispiel zwei erklärende Variablen zur Darstellung von Temperatur und Feuchtigkeit verwenden und der Temperaturwert vor dem Feuchtigkeitswert erwartet wird, dann müssen Sie diese Variablen in dieser Reihenfolge angeben. Die richtige Reihenfolge der Variablen in der Eingabe-Modelldatei können Sie anhand der abgeleiteten Ausgaben des Werkzeugs Modelldatei für räumliche Statistiken beschreiben ermitteln.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Modelldatei

Die Modelldatei für räumliche Statistiken, die für neue Vorhersagen verwendet werden soll.

File
Vorhersagetyp

Gibt den zu verwendenden Operationsmodus an. Das Werkzeug kann neue Features vorhersagen oder eine Vorhersage-Raster-Oberfläche erstellen.

  • Features vorhersagenEs werden Vorhersagen oder Klassifizierungen für Features generiert. Es müssen erklärende Variablen zum Abgleichen der Variablen, die zum Trainieren der Eingabe-Modelldatei verwendet wurden, angegeben werden. Die Ausgaben dieser Option sind eine Feature-Class und Modelldiagnosen im Meldungsfenster.
  • Raster vorhersagenFür den Bereich, in dem sich die erklärenden Raster überschneiden, wird ein Vorhersage-Raster generiert. Es müssen erklärende Raster zum Abgleichen der Raster, die zum Trainieren der Eingabe-Modelldatei verwendet wurden, angegeben werden. Die Ausgaben dieser Option sind eine vorhergesagte Oberfläche und Modelldiagnosen im Meldungsfenster.
String
Eingabe-Vorhersage-Features
(optional)

Die Feature-Class, die Positionen darstellt, an denen Vorhersagen getroffen werden. Diese Feature-Class muss auch erklärende Variablen enthalten, die als Felder bereitgestellt wurden und den zum Trainieren des Eingabemodells verwendeten Feldern entsprechen.

Feature Layer
Vorhergesagte Ausgabe-Features
(optional)

Die Ausgabe-Feature-Class mit den Vorhersageergebnissen.

Feature Class
Vorhergesagtes Ausgabe-Raster
(optional)

Das Ausgabe-Raster mit den Vorhersageergebnissen. Die Standard-Zellengröße entspricht der maximalen Zellengröße der Eingabe-Raster.

Raster Dataset
Erklärende Variablen abgleichen
(optional)

Eine Liste der erklärenden Variablen des Eingabemodells und der entsprechenden Felder der Eingabe-Vorhersage-Features. Geben Sie für jede erklärende Variable in der Spalte Training das entsprechende Vorhersagefeld in der Spalte Prediction an. In der Spalte Categorical wird angegeben, ob die Variable kategorisch oder kontinuierlich ist.

Value Table
Entfernungs-Features abgleichen
(optional)

Eine Liste der erklärenden Entfernungs-Features des Eingabemodells und der entsprechenden Entfernungs-Features der Vorhersage. Geben Sie für jedes erklärende Entfernungs-Feature in der Spalte Training das entsprechende Entfernungs-Feature der Vorhersage in der Spalte Prediction an.

Value Table
Erklärende Raster abgleichen
(optional)

Eine Liste der erklärenden Raster des Eingabemodells und der entsprechenden Vorhersage-Raster. Geben Sie für jedes erklärende Raster in der Spalte Training das entsprechende Vorhersage-Raster in der Spalte Prediction an. In der Spalte Categorical wird angegeben, ob das Raster kategorisch oder kontinuierlich ist.

Value Table

arcpy.stats.PredictUsingSSMFile(input_model, prediction_type, {features_to_predict}, {output_features}, {output_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching})
NameErläuterungDatentyp
input_model

Die Modelldatei für räumliche Statistiken, die für neue Vorhersagen verwendet werden soll.

File
prediction_type

Gibt den zu verwendenden Operationsmodus an. Das Werkzeug kann neue Features vorhersagen oder eine Vorhersage-Raster-Oberfläche erstellen.

  • PREDICT_FEATURESEs werden Vorhersagen oder Klassifizierungen für Features generiert. Es müssen erklärende Variablen zum Abgleichen der Variablen, die zum Trainieren der Eingabe-Modelldatei verwendet wurden, angegeben werden. Die Ausgaben dieser Option sind eine Feature-Class und Modelldiagnosen im Meldungsfenster.
  • PREDICT_RASTERFür den Bereich, in dem sich die erklärenden Raster überschneiden, wird ein Vorhersage-Raster generiert. Es müssen erklärende Raster zum Abgleichen der Raster, die zum Trainieren der Eingabe-Modelldatei verwendet wurden, angegeben werden. Die Ausgaben dieser Option sind eine vorhergesagte Oberfläche und Modelldiagnosen im Meldungsfenster.
String
features_to_predict
(optional)

Die Feature-Class, die Positionen darstellt, an denen Vorhersagen getroffen werden. Diese Feature-Class muss auch erklärende Variablen enthalten, die als Felder bereitgestellt wurden und den zum Trainieren des Eingabemodells verwendeten Feldern entsprechen.

Feature Layer
output_features
(optional)

Die Ausgabe-Feature-Class mit den Vorhersageergebnissen.

Feature Class
output_raster
(optional)

Das Ausgabe-Raster mit den Vorhersageergebnissen. Die Standard-Zellengröße entspricht der maximalen Zellengröße der Eingabe-Raster.

Raster Dataset
explanatory_variable_matching
[[pred1, train1, cat1], [pred2, train2, cat2],...]
(optional)

Eine Liste der erklärenden Variablen des Eingabemodells und der entsprechenden Felder der Eingabe-Vorhersage-Features. Geben Sie für jede erklärende Variable in der Spalte Training das entsprechende Vorhersagefeld in der Spalte Prediction an. In der Spalte Categorical wird angegeben, ob die Variable kategorisch oder kontinuierlich ist.

Value Table
explanatory_distance_matching
[[pred1, cat1], [pred2, cat2],...]
(optional)

Eine Liste der erklärenden Entfernungs-Features des Eingabemodells und der entsprechenden Entfernungs-Features der Vorhersage. Geben Sie für jedes erklärende Entfernungs-Feature in der Spalte Training das entsprechende Entfernungs-Feature der Vorhersage in der Spalte Prediction an.

Value Table
explanatory_rasters_matching
[[pred1, train1, cat1], [pred2, train2, cat2],...]
(optional)

Eine Liste der erklärenden Raster des Eingabemodells und der entsprechenden Vorhersage-Raster. Geben Sie für jedes erklärende Raster in der Spalte Training das entsprechende Vorhersage-Raster in der Spalte Prediction an. In der Spalte Categorical wird angegeben, ob das Raster kategorisch oder kontinuierlich ist.

Value Table

Codebeispiel

PredictUsingSSMFile: Beispiel 1 (Python-Fenster)

Das folgende Skript im Python-Fenster veranschaulicht, wie Sie die Funktion PredictUsingSSMFile verwenden.


arcpy.stats.PredictUsingSSMFile(
      "PredictAsthma_Forest.ssm", "PREDICT_FEATURES", 
      "MedicareSpendingData", "Predicted_features", None, 
      "AVERAGE_HCC_SCORE_2010_CAT AVERAGE_HCC_SCORE_2010_CAT true;
      HOSPBEDSD_INT HOSPBEDSD_INT false; 
      PERCENT_ASTHMA_2010_DBL PERCENT_ASTHMA_2010_DBL false", 
      "Distance_Hospital DF_POLY", "EVANDMAND_RASTER EVANDMAND #")
PredictUsingSSMFile: Beispiel 2 (eigenständiges Skript)

Das folgende eigenständige Python-Skript veranschaulicht, wie die Funktion PredictUsingSSMFile verwendet wird.

# Predict to Raster using the Predict using spatial statistics model file tool 

# Import system modules.
import arcpy
import os

# Set workspace.
arcpy.env.workspace = r"C:\Analysis"
arcpy.env.overwriteOutput = True

# Read the explanatory raster order and variable names using Describe Spatial 
# Statistics Model File tool.
in_model = "Suitability.ssm"
desc_result = arcpy.stats.DescribeSSMFile(in_model)

# Print the list of explanatory rasters.
print(desc_result[2])

# Split the explanatory raster strings into a list of variable names.
exp_ras = desc_result[2].split(";")

# Set Parameters for prediction.
prediction_type="PREDICT_RASTER"
out_raster= "suitability_predicted_raster.tif"
match_exp_ras0 = "Climate_Bio2050.tif"
match_exp_ras1 = "Climate_Temp2050.tif"
match_exp_ras2 = "Climate_Solar2050.tif"
match_rasters = [[match_exp_ras0, exp_ras[0], None], 
                 [match_exp_ras1, exp_ras[1], None], 
                 [match_exp_ras2, exp_ras[2], None]]

# Run tool.
arcpy.stats.PredictUsingSSMFile(in_model, prediction_type, "", "", out_raster, 
                "", "", match_rasters)