ラベル | 説明 | データ タイプ |
入力モデルファイル | 新しい予測を立てる際に使用される空間統計モデル ファイル。 | File |
予測タイプ | 使用される操作モードを指定します。 このツールでは、新しいフィーチャを予測するか、予測ラスター サーフェスを作成することができます。
| String |
入力予測フィーチャ (オプション) | 予測が行われるロケーションを表すフィーチャクラス。 このフィーチャクラスには、入力モデルのトレーニングに使用されるフィールドに対応するフィールドとして指定された説明変数も含める必要があります。 | Feature Layer |
出力予測済みフィーチャ (オプション) | 予測結果を含む出力フィーチャクラス。 | Feature Class |
出力予測ラスター (オプション) | 予測結果を含む出力ラスター。 デフォルトのセル サイズは、入力ラスターの最大セル サイズになります。 | Raster Dataset |
説明変数の照合 (オプション) | 入力モデルの説明変数と入力予測フィーチャの対応するフィールドのリスト。 Training 列の説明変数ごとに、それに対応する予測フィールドを Prediction 列に指定します。 Categorical 列には、変数がカテゴリであるか連続であるかを指定します。 | Value Table |
距離フィーチャの照合 (オプション) | 入力モデルの説明距離フィーチャとそれに対応する予測距離フィーチャのリスト。 Training 列の説明距離変数ごとに、それに対応する予測距離フィーチャを Prediction 列に指定します。 | Value Table |
説明ラスターの照合 (オプション) | 入力モデルの説明ラスターとそれに対応する予測ラスターのリスト。 Training 列の説明ラスターごとに、それに対応する予測ラスターを Prediction 列に指定します。 Categorical 列には、ラスターがカテゴリであるか連続であるかを指定します。 | Value Table |
使用法
このツールの使用に関するシナリオの例を次に示します。
- 上流の工場や主要な港までの距離などのデータに加えて、属性とラスターの両方で表された多数の環境説明変数を使用して海草の発生に関してトレーニング済みのフォレストベースの分類と回帰分析モデルの場合、これらの環境説明変数の今後の予測に基づいて、将来の海草の発生を予測することができます。
- エキスパートがトレーニングしたモデルは、機密性の高いデータを共有せずに、他のユーザーと共有して予測を立てることができます。 たとえば、子供の血中の鉛濃度やその子供の家の課税パーセル ID に関するモデルと、家の築年数などのパーセルレベルの属性、収入や教育レベルなどの国勢調査レベルのデータ、鉛および鉛化合物の有害物排出を反映した全国規模のデータセットが組み合わされた場合は、血中の鉛濃度のデータなしでパーセルの鉛汚染のリスクを予測できます。 これらのリスク予測は、地域の警察や教育プログラムに影響する可能性があります。
- ある野生生物の生態学者は、絶滅危惧種の観測済みの生息地に関するフィールド データを収集しました。 学者たちは、より広い分析範囲でその種の生息を推定し、調査内容を他の研究者と共有する必要があります。 既知の生息地を使用し、ラスターとしてベース ファクターを指定することで、生態学者は、Presence-only 予測を使用してその種の生息をモデル化し、種の発生に関する機密情報を共有せずにトレーニング済みのモデルを共有することができます。 このモデルを使用すると、種が見つかる可能性が最も高い予測場所のマップを作成できます。
[入力モデル ファイル] パラメーターの値は、空間統計ツールボックスの空間関係のモデリング ツールセット内のさまざまなツールで作成された .ssm ファイルです。 モデル ファイルを作成するには、[一般化線形回帰分析 (Generalized Linear Regression)]、[フォレストベースおよびブースト分類と回帰分析 (Forest-based and Boosted Classification and Regression)]、および [Presence-only 予測 (MaxEnt) (Presence-only Prediction (MaxEnt))] ツールを使用し、各ツールで [出力トレーニング済みモデル ファイル] パラメーターの値を指定します。
各モデル タイプで予測を立てる方法については、「一般化線形回帰分析 (Generalized Linear Regression) の詳細」、「フォレストベースおよびブースト分類と回帰分析 (Forest-based and Boosted Classification and Regression) の機能」、および「Presence-only 予測 (Presence-only Prediction (MaxEnt)) の仕組み」をご参照ください。
[予測タイプ] パラメーターの [フィーチャに関する予測] オプションを使用する場合は、[出力予測済みフィーチャ] パラメーターで、予測を含むフィーチャクラスを作成します。 [ラスターに関する予測] オプションを使用する場合は、[出力予測サーフェス] パラメーターで、予測値のラスターを作成します。
ラスターに関する予測では、ラスターをだけを使用して .ssm ファイルをトレーニングする必要があります。
ラスターでトレーニングされた .ssm ファイルを使用するには、ArcGIS Spatial Analyst extension ライセンスが必要です。
注意:
このツールを実行する前に [空間統計モデル ファイルの説明 (Describe Spatial Statistics Model File)] ツールを実行して、変数の名前、タイプ、説明、および単位を認識し、それに応じてデータを準備しておくことをお勧めします。 モデル診断を使用して、入力モデル ファイルの品質を評価することもできます。
説明変数は、フィールドから取得するか、距離フィーチャから算出するか、ラスターから抽出することができます。 説明変数の組み合わせは、入力モデル ファイルと一致する必要があります。
モデル ファイルの作成中に説明変数またはラスターがカテゴリとしてマークされると、[カテゴリ] パラメーターがオンになり、一致する変数がカテゴリと見なされます。 このツールを実行する前に [空間統計モデル ファイルの説明 (Describe Spatial Statistics Model File)] ツールを使用すると、モデル ファイル内でどの変数がカテゴリであるかを特定できます。
トレーニング変数と予測変数のフィールド タイプを一致させる必要があります。 たとえば、すべての数値フィールド タイプはその他すべての数値フィールド タイプと一致させることができますが、トレーニング フィールドがテキストの場合は、それに対応する予測変数もテキストでなければなりません。
注意:
トレーニング変数と予測変数を一致させる前に、変数の単位を設定しておくことをお勧めします。 トレーニング済みモデル ファイルと予測変数の単位が異なる場合は、正しい結果が生成されない可能性があります。 たとえば、米ドルの収入変数を使用してモデルをトレーニングし、予測を立てる際に、その変数をインド ルピーの収入と一致させた場合は、トレーニング変数と予測変数の間で一連の変数が整合しないため、予測変数が不正確になる可能性があります。
このツールでは、モデルのパフォーマンスを示すメッセージとチャートも作成されます。 このメッセージにアクセスするには、[ジオプロセシング] ウィンドウで、進行状況バーにポインターを合わせてポップアップ ボタンをクリックするか、メッセージ セクションを展開します。 ジオプロセシング履歴から、以前に実行したツールのメッセージにアクセスすることもできます。 これらのメッセージには、モデル診断とモデルに関する他の情報が示されています。
ジオプロセシング メッセージの [モデル パラメーター] テーブルには、予測する変数およびフィールド タイプと、モデルの作成に使用された説明変数が記載されています。 また、このテーブルには、各変数の単位も含まれているため ([空間統計モデル ファイルのプロパティを設定 (Set Spatial Statistics Model File Properties)] ツールを使用して設定した場合)、モデルを使用して予測を立てる際に予測変数と一致させることができます。
注意:
予測の結果を信頼する前に、モデル診断を評価することをお勧めします。 整合チェック データを除外せずにモデルをトレーニングした場合は、予測の精度を評価することができません。
注意:
ArcPy を使用してこのツールを実行する場合は、[説明変数の照合]、[距離フィーチャの照合]、および [説明ラスターの照合] パラメーターの値テーブルに指定された変数の順序と大文字/小文字が重要となります。 たとえば、温度と湿度を表す 2 つの説明変数があり、湿度の値の前に温度の値があることが予想される場合は、その順序で変数を指定する必要があります。 [空間統計モデル ファイルの説明 (Describe Spatial Statistics Model File)] ツールから生成された出力を使用すると、入力モデル ファイルに格納された変数の正確な順序を取得できます。
パラメーター
arcpy.stats.PredictUsingSSMFile(input_model, prediction_type, {features_to_predict}, {output_features}, {output_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching})
名前 | 説明 | データ タイプ |
input_model | 新しい予測を立てる際に使用される空間統計モデル ファイル。 | File |
prediction_type | 使用される操作モードを指定します。 このツールでは、新しいフィーチャを予測するか、予測ラスター サーフェスを作成することができます。
| String |
features_to_predict (オプション) | 予測が行われるロケーションを表すフィーチャクラス。 このフィーチャクラスには、入力モデルのトレーニングに使用されるフィールドに対応するフィールドとして指定された説明変数も含める必要があります。 | Feature Layer |
output_features (オプション) | 予測結果を含む出力フィーチャクラス。 | Feature Class |
output_raster (オプション) | 予測結果を含む出力ラスター。 デフォルトのセル サイズは、入力ラスターの最大セル サイズになります。 | Raster Dataset |
explanatory_variable_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (オプション) | 入力モデルの説明変数と入力予測フィーチャの対応するフィールドのリスト。 Training 列の説明変数ごとに、それに対応する予測フィールドを Prediction 列に指定します。 Categorical 列には、変数がカテゴリであるか連続であるかを指定します。 | Value Table |
explanatory_distance_matching [[pred1, cat1], [pred2, cat2],...] (オプション) | 入力モデルの説明距離フィーチャとそれに対応する予測距離フィーチャのリスト。 Training 列の説明距離変数ごとに、それに対応する予測距離フィーチャを Prediction 列に指定します。 | Value Table |
explanatory_rasters_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (オプション) | 入力モデルの説明ラスターとそれに対応する予測ラスターのリスト。 Training 列の説明ラスターごとに、それに対応する予測ラスターを Prediction 列に指定します。 Categorical 列には、ラスターがカテゴリであるか連続であるかを指定します。 | Value Table |
コードのサンプル
次の Python ウィンドウ スクリプトは、PredictUsingSSMFile 関数の使用方法を示しています。
arcpy.stats.PredictUsingSSMFile(
"PredictAsthma_Forest.ssm", "PREDICT_FEATURES",
"MedicareSpendingData", "Predicted_features", None,
"AVERAGE_HCC_SCORE_2010_CAT AVERAGE_HCC_SCORE_2010_CAT true;
HOSPBEDSD_INT HOSPBEDSD_INT false;
PERCENT_ASTHMA_2010_DBL PERCENT_ASTHMA_2010_DBL false",
"Distance_Hospital DF_POLY", "EVANDMAND_RASTER EVANDMAND #")
次のスタンドアロン Python スクリプトで、PredictUsingSSMFile 関数を使用する方法を示します。
# Predict to Raster using the Predict using spatial statistics model file tool
# Import system modules.
import arcpy
import os
# Set workspace.
arcpy.env.workspace = r"C:\Analysis"
arcpy.env.overwriteOutput = True
# Read the explanatory raster order and variable names using Describe Spatial
# Statistics Model File tool.
in_model = "Suitability.ssm"
desc_result = arcpy.stats.DescribeSSMFile(in_model)
# Print the list of explanatory rasters.
print(desc_result[2])
# Split the explanatory raster strings into a list of variable names.
exp_ras = desc_result[2].split(";")
# Set Parameters for prediction.
prediction_type="PREDICT_RASTER"
out_raster= "suitability_predicted_raster.tif"
match_exp_ras0 = "Climate_Bio2050.tif"
match_exp_ras1 = "Climate_Temp2050.tif"
match_exp_ras2 = "Climate_Solar2050.tif"
match_rasters = [[match_exp_ras0, exp_ras[0], None],
[match_exp_ras1, exp_ras[1], None],
[match_exp_ras2, exp_ras[2], None]]
# Run tool.
arcpy.stats.PredictUsingSSMFile(in_model, prediction_type, "", "", out_raster,
"", "", match_rasters)
環境
特殊なケース
- 乱数ジェネレーター
使用される乱数ジェネレーターのタイプは常にメルセンヌ ツイスターです。