空間統計モデルファイルを使用して予測 (Predict Using Spatial Statistics Model File) (空間統計)—ArcGIS AllSource

サマリー

トレーニング済みの空間統計モデル (.ssm ファイル) を使用して連続値またはカテゴリー値を予測します。

使用法

このツールの使用シナリオには次のようなものがあります。
- 上流の工場や主要な港までの距離などのデータに加えて、属性とラスターの両方で表された多数の環境説明変数を使用して海草の発生に関してトレーニング済みのフォレストベースの分類と回帰分析モデルの場合、これらの環境説明変数の今後の予測に基づいて、将来の海草の発生を予測することができます。
- エキスパートがトレーニングしたモデルは、機密性の高いデータを共有せずに、他のユーザーと共有して予測を立てることができます。たとえば、子供の血中の鉛濃度やその子供の家の課税パーセル ID に関するモデルと、家の築年数などのパーセルレベルの属性、収入や教育レベルなどの国勢調査レベルのデータ、鉛および鉛化合物の有害物排出を反映した全国規模のデータセットが組み合わされた場合は、血中の鉛濃度のデータなしでパーセルの鉛汚染のリスクを予測できます。これらのリスク予測は、地域の警察や教育プログラムに影響する可能性があります。
- ある野生生物の生態学者は、絶滅危惧種の観測済みの生息地に関するフィールドデータを収集しました。学者たちは、より広い分析範囲でその種の生息を推定し、調査内容を他の研究者と共有する必要があります。既知の生息地を使用し、ラスターとしてベースファクターを指定することで、生態学者は、Presence-only 予測を使用してその種の生息をモデル化し、種の発生に関する機密情報を共有せずにトレーニング済みのモデルを共有することができます。このモデルを使用すると、種が見つかる可能性が最も高い予測場所のマップを作成できます。
[入力モデルファイル] パラメーターの値は、空間統計ツールボックスの空間関係のモデリングツールセット内のさまざまなツールで作成された .ssm ファイルです。モデルファイルを作成するには、[一般化線形回帰分析 (Generalized Linear Regression)]、[フォレストベースおよびブースト分類と回帰分析 (Forest-based and Boosted Classification and Regression)]、および [Presence-only 予測 (MaxEnt) (Presence-only Prediction (MaxEnt))] ツールを使用し、各ツールで [出力トレーニング済みモデルファイル] パラメーターの値を指定します。
各モデルタイプで予測を立てる方法については、「一般化線形回帰分析の詳細」、「フォレストベースおよびブースト分類と回帰分析の機能」、および「Presence-only 予測の仕組み」をご参照ください。
[予測タイプ] パラメーターの [フィーチャに関する予測] オプションを使用する場合は、[出力予測済みフィーチャ] パラメーターで、予測を含むフィーチャクラスを作成します。 [ラスターに関する予測] オプションを使用する場合は、[出力予測サーフェス] パラメーターで、予測値のラスターを作成します。
ラスターに関する予測では、ラスターをだけを使用して .ssm ファイルをトレーニングする必要があります。
ラスターでトレーニングされた .ssm ファイルを使用するには、ArcGIS Spatial Analyst エクステンションライセンスが必要です。
注意:
このツールを実行する前に [空間統計モデルファイルの説明 (Describe Spatial Statistics Model File)] ツールを実行して、変数の名前、タイプ、説明、および単位を認識し、それに応じてデータを準備しておくことをおすすめします。モデル診断を使用して、入力モデルファイルの品質を評価することもできます。
説明変数は、フィールドから取得するか、距離フィーチャから算出するか、ラスターから抽出することができます。説明変数の組み合わせは、入力モデルファイルと一致する必要があります。
モデルファイルの作成中に説明変数またはラスターがカテゴリーとしてマークされると、[カテゴリ] パラメーターがオンになり、一致する変数がカテゴリーと見なされます。このツールを実行する前に [空間統計モデルファイルの説明 (Describe Spatial Statistics Model File)] ツールを使用すると、モデルファイル内でどの変数がカテゴリーであるかを特定できます。
トレーニング変数と予測変数のフィールドタイプを一致させる必要があります。たとえば、すべての数値フィールドタイプはその他すべての数値フィールドタイプと一致させることができますが、トレーニングフィールドがテキストの場合は、それに対応する予測変数もテキストでなければなりません。
注意:
トレーニング変数と予測変数を一致させる前に、変数の単位を設定しておくことをおすすめします。トレーニング済みモデルファイルと予測変数の単位が異なる場合は、正しい結果が生成されない可能性があります。たとえば、米ドルの収入変数を使用してモデルをトレーニングし、予測を立てる際に、その変数をインドルピーの収入と一致させた場合は、トレーニング変数と予測変数の間で一連の変数が整合しないため、予測変数が不正確になる可能性があります。
このツールでは、モデルのパフォーマンスを示すメッセージとチャートも作成されます。このメッセージにアクセスするには、[ジオプロセシング] ウィンドウで、進行状況バーにポインターを合わせてポップアップボタンをクリックするか、メッセージセクションを展開します。ジオプロセシング履歴から、以前に実行したツールのメッセージにアクセスすることもできます。これらのメッセージには、モデル診断とモデルに関する他の情報が示されています。
ジオプロセシングメッセージの [モデルパラメーター] テーブルには、予測する変数およびフィールドタイプと、モデルの作成に使用された説明変数が記載されています。また、このテーブルには、各変数の単位も含まれているため ([空間統計モデルファイルのプロパティを設定 (Set Spatial Statistics Model File Properties)] ツールを使用して設定した場合)、モデルを使用して予測を立てる際に予測変数と一致させることができます。
注意:
予測の結果を信頼する前に、モデル診断を評価することをおすすめします。検証データを除外せずにモデルをトレーニングした場合は、予測の精度を評価することができません。
注意:
ArcPy を使用してこのツールを実行する場合は、[説明変数の照合]、[距離フィーチャの照合]、および [説明ラスターの照合] パラメーターの値テーブルに指定された変数の順序と大文字/小文字が重要となります。たとえば、温度と湿度を表す 2 つの説明変数があり、湿度の値の前に温度の値があることが予想される場合は、その順序で変数を指定する必要があります。 [空間統計モデルファイルの説明 (Describe Spatial Statistics Model File)] ツールから生成された出力を使用すると、入力モデルファイルに格納された変数の正確な順序を取得できます。
モデルの予測を実際の観測値と比較して評価するには、[予測との比較フィールド (Field to Compare to Predictions)] パラメーターを使用します。入力予測フィーチャに実際の観測値を含むフィールドがある場合、それを [予測との比較フィールド (Field to Compare to Predictions)] パラメーターの値に設定します。これにより、ジオプロセシングメッセージに評価メトリックが追加され、シンボルが回帰の場合は残差に、分類の場合は正確度の状態に変更されます。
[予測との比較フィールド (Field to Compare to Predictions)] パラメーターが指定されている場合、出力のシンボルは、回帰分析では残差を、分類分析では予測が正しかったかどうかを示します。
[予測との比較フィールド (Field to Compare to Predictions)] パラメーターが指定されている場合、ジオプロセシングメッセージに、分類の正確度や予測の相関係数の二乗などの評価メトリックを含む追加の [検証データ] テーブルが表示されます。

パラメーター

ラベル	説明	データタイプ
入力モデルファイル	新しい予測を立てる際に使用される空間統計モデルファイル。	File
予測タイプ	使用される操作モードを指定します。このツールでは、新しいフィーチャを予測するか、予測ラスターサーフェスを作成することができます。フィーチャに関する予測—フィーチャに関する予測または分類が生成されます。入力モデルファイルのトレーニングに使用される変数を一致させるために説明変数を指定する必要があります。このオプションの出力内容は、フィーチャクラスと、メッセージウィンドウ内のモデル診断です。ラスターに関する予測—説明ラスターが交差するエリアに関して予測ラスターが生成されます。入力モデルファイルのトレーニングに使用されるラスターを一致させるために説明ラスターを指定する必要があります。このオプションの出力内容は、予測サーフェスと、メッセージウィンドウ内のモデル診断です。	String
入力予測フィーチャ (オプション)	予測が行われるロケーションを表すフィーチャクラス。このフィーチャクラスには、入力モデルのトレーニングに使用されるフィールドに対応するフィールドとして指定された説明変数も含める必要があります。	Feature Layer
出力予測済みフィーチャ (オプション)	予測結果を含む出力フィーチャクラス。	Feature Class
出力予測ラスター (オプション)	予測結果を含む出力ラスター。デフォルトのセルサイズは、入力ラスターの最大セルサイズになります。	Raster Dataset
説明変数の照合 (オプション)	入力モデルの説明変数と入力予測フィーチャの対応するフィールドのリスト。 Training 列の説明変数ごとに、それに対応する予測フィールドを Prediction 列に指定します。 Categorical 列には、変数がカテゴリーであるか連続であるかを指定します。	Value Table
距離フィーチャの照合 (オプション)	入力モデルの説明距離フィーチャとそれに対応する予測距離フィーチャのリスト。 Training 列の説明距離変数ごとに、それに対応する予測距離フィーチャを Prediction 列に指定します。	Value Table
説明ラスターの照合 (オプション)	入力モデルの説明ラスターとそれに対応する予測ラスターのリスト。 Training 列の説明ラスターごとに、それに対応する予測ラスターを Prediction 列に指定します。 Categorical 列には、ラスターがカテゴリーであるか連続であるかを指定します。	Value Table
予測との比較フィールド (オプション)	.ssm ファイルを作成した元のツールで予測された変数の実際の観測値を含む、[入力予測フィーチャ] パラメーター値に含まれるフィールドです。このフィールドが指定されている場合、モデルが実際の値をどの程度予測できているかを評価するための評価メトリックがジオプロセシングツールのメッセージに含まれます。 .ssm ファイルを作成した元のツールで予測された変数の実際の観測値を含む、features_to_predict パラメーター値に含まれるフィールドです。このフィールドが指定されている場合、モデルが実際の値をどの程度予測できているかを評価するための評価メトリックがジオプロセシングツールのメッセージに含まれます。	Field

arcpy.stats.PredictUsingSSMFile(input_model, prediction_type, {features_to_predict}, {output_features}, {output_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching}, {field_to_compare})

名前	説明	データタイプ
input_model	新しい予測を立てる際に使用される空間統計モデルファイル。	File
prediction_type	使用される操作モードを指定します。このツールでは、新しいフィーチャを予測するか、予測ラスターサーフェスを作成することができます。 PREDICT_FEATURES—フィーチャに関する予測または分類が生成されます。入力モデルファイルのトレーニングに使用される変数を一致させるために説明変数を指定する必要があります。このオプションの出力内容は、フィーチャクラスと、メッセージウィンドウ内のモデル診断です。 PREDICT_RASTER—説明ラスターが交差するエリアに関して予測ラスターが生成されます。入力モデルファイルのトレーニングに使用されるラスターを一致させるために説明ラスターを指定する必要があります。このオプションの出力内容は、予測サーフェスと、メッセージウィンドウ内のモデル診断です。	String
features_to_predict (オプション)	予測が行われるロケーションを表すフィーチャクラス。このフィーチャクラスには、入力モデルのトレーニングに使用されるフィールドに対応するフィールドとして指定された説明変数も含める必要があります。	Feature Layer
output_features (オプション)	予測結果を含む出力フィーチャクラス。	Feature Class
output_raster (オプション)	予測結果を含む出力ラスター。デフォルトのセルサイズは、入力ラスターの最大セルサイズになります。	Raster Dataset
explanatory_variable_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (オプション)	入力モデルの説明変数と入力予測フィーチャの対応するフィールドのリスト。 Training 列の説明変数ごとに、それに対応する予測フィールドを Prediction 列に指定します。 Categorical 列には、変数がカテゴリーであるか連続であるかを指定します。	Value Table
explanatory_distance_matching [[pred1, cat1], [pred2, cat2],...] (オプション)	入力モデルの説明距離フィーチャとそれに対応する予測距離フィーチャのリスト。 Training 列の説明距離変数ごとに、それに対応する予測距離フィーチャを Prediction 列に指定します。	Value Table
explanatory_rasters_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (オプション)	入力モデルの説明ラスターとそれに対応する予測ラスターのリスト。 Training 列の説明ラスターごとに、それに対応する予測ラスターを Prediction 列に指定します。 Categorical 列には、ラスターがカテゴリーであるか連続であるかを指定します。	Value Table
field_to_compare (オプション)		Field

コードのサンプル

PredictUsingSSMFile の例 1 (Python ウィンドウ)

次の Python ウィンドウスクリプトは、PredictUsingSSMFile 関数の使用方法を示しています。


arcpy.stats.PredictUsingSSMFile(
      "PredictAsthma_Forest.ssm", "PREDICT_FEATURES", 
      "MedicareSpendingData", "Predicted_features", None, 
      "AVERAGE_HCC_SCORE_2010_CAT AVERAGE_HCC_SCORE_2010_CAT true;HOSPBEDSD_INT HOSPBEDSD_INT false;PERCENT_ASTHMA_2010_DBL PERCENT_ASTHMA_2010_DBL false", 
      "Distance_Hospital DF_POLY", "EVANDMAND_RASTER EVANDMAND #")

PredictUsingSSMFile の例 2 (スタンドアロンスクリプト)

次のスタンドアロン Python スクリプトで、PredictUsingSSMFile 関数を使用する方法を示します。

# Predict to Raster using the Predict using spatial statistics model file tool 

# Import system modules.
import arcpy
import os

# Set workspace.
arcpy.env.workspace = r"C:\Analysis"
arcpy.env.overwriteOutput = True

# Read the explanatory raster order and variable names using Describe Spatial 
# Statistics Model File tool.
in_model = "Suitability.ssm"
desc_result = arcpy.stats.DescribeSSMFile(in_model)

# Print the list of explanatory rasters.
print(desc_result[2])

# Split the explanatory raster strings into a list of variable names.
exp_ras = desc_result[2].split(";")

# Set Parameters for prediction.
prediction_type="PREDICT_RASTER"
out_raster= "suitability_predicted_raster.tif"
match_exp_ras0 = "Climate_Bio2050.tif"
match_exp_ras1 = "Climate_Temp2050.tif"
match_exp_ras2 = "Climate_Solar2050.tif"
match_rasters = [[match_exp_ras0, exp_ras[0], None], 
                 [match_exp_ras1, exp_ras[1], None], 
                 [match_exp_ras2, exp_ras[2], None]]

# Run tool.
arcpy.stats.PredictUsingSSMFile(in_model, prediction_type, "", "", out_raster, 
                "", "", match_rasters)

環境

出力座標系, 並列処理ファクター, セルサイズ, 範囲, セルサイズ投影法, マスク, 乱数ジェネレーター, スナップ対象ラスター

特殊なケース

乱数ジェネレーター: 使用される乱数ジェネレーターのタイプは常にメルセンヌツイスターです。

サマリー

使用法

注意:

注意:

注意:

注意:

パラメーター

コードのサンプル

環境

特殊なケース

関連トピック

このトピックの内容