Presence-only 予測 (Presence-only Prediction (MaxEnt)) (空間統計)

サマリー

最大エントロピー アプローチ (MaxEnt) を使用して、指定された既知の存在ロケーションと説明変数の現象の存在をモデル化します。 存在確率を含み、存在が既知で不在が未知である問題にのみ適用できる出力フィーチャをツールは提供します。

Presence-only 予測 (MaxEnt) の仕組みの詳細

Presence-only 予測 (MaxEnt) ツールの図

使用法

  • このツールでは、既知の存在ロケーション、存在の可能性のある分析範囲、説明変数という 3 つの主要な入力値を使用して、存在予測モデルを作成します。

    • [入力ポイント フィーチャ] パラメーターの値を使用して、対象となる事象の既知の存在ロケーションを指定します。
    • 分析範囲は、背景ポイントを特徴としています。 背景ポイントは分析範囲全体に分布されており、対象となる事象の存在の可能性があるが、未知のロケーションです。 背景ポイントは、このツールで自動的に作成するか、[背景ポイントを含む] パラメーターをオンにして手動で入力ポイント フィーチャに含めることができます。
    • このツールでは、説明変数をラスター、フィールド、および距離フィーチャの形式で使用できます。

  • このツールは、[背景ポイントを含む] パラメーターに指定された次の 2 つのモードで実行することができます。

    • [オフ] - このツールが存在のみのポイントで実行され、ラスター ソースから取得された説明変数だけが使用されます。
    • [オン] - このツールが存在ポイントと背景ポイントで実行され、説明変数ソースにラスター、入力ポイント フィーチャ内のフィールド、および距離フィーチャを含めることができます。

  • ラスターをツールの入力または出力として使用するには ArcGIS Spatial Analyst extension ライセンスが必要です。

  • [出力トレーニング済みモデル ファイル] パラメーターを使用すると、トレーニング済みモデルの結果を再利用できるファイルとして保存することができます。 [空間統計モデル ファイルを使用して予測 (Predict Using Spatial Statistics Model File)] ツールを使用すると、モデル ファイルで新しいフィーチャの予測を立てることができます。

  • このツールでは、モデルを作成するために入力ポイント フィーチャ内の少なくとも 2 つの存在ポイントが必要となります。 入力フィーチャに背景ポイントが含まれている場合は、モデルを作成するために少なくとも 2 つの背景ポイントも必要となります。

  • [背景ポイントを含む] パラメーターがオフになっている場合、[説明トレーニング距離フィーチャ] パラメーターは使用できません。 存在のみのデータの説明変数として距離をフィーチャに含めるには、[距離累積 (Distance Accumulation)] ツールを使用して距離ラスターを計算し、[説明トレーニング ラスター] パラメーターに距離ラスターを含めます。

  • [説明トレーニング ラスター] パラメーターの空間解像度は以下の理由により重要です。

    • セル サイズは処理時間に大きく影響します。 ラスター解像度が高いほど、処理時間が長くなります。
    • ツールではラスターのセルの重心を使用して、存在のみのデータ ([背景ポイントを含む] パラメーターがオフ) を使用する際に背景ポイントを生成します。 存在ポイントに対する背景ポイントの割合はモデルに影響を及ぼします。ラスターのセル サイズを考慮し、[出力トレーニング済みフィーチャ] パラメーターを使用して結果背景ポイントを調査することで、分析範囲に関する想定が質問に対して適切になるようにすることをおすすめします。
      注意:

      [リサンプル (Resample)] ツールを使用して、説明トレーニング ラスターの空間解像度を減少させることができます。

  • [分析範囲] パラメーター、または背景ポイントを含む入力ポイント フィーチャのロケーションの定義済みの分析範囲はモデルの成果に影響します。 使用する範囲によって、背景ポイントとして使用されるラスター セルが決まります。 これにより、存在条件と比較され、予測結果に影響する相対発生率を確立する環境条件が確立されます。

  • 背景ポイントの意味を指定するには [存在から背景までの相対ウェイト] パラメーターを使用します。 未知の存在があるロケーションを背景ポイントが表す場合は、値として 100 を使用します。 観測された不在があるロケーションを背景ポイントが表す場合は、値として 1 を使用します。

    • この値は、モデルの動作とツールが生成する予測に影響を及ぼします。 値が 100 に近い場合、モデルは間違って分類された各背景ポイントの 100 倍のペナルティを間違って分類された各存在ポイントに課し (背景の正しい分類が存在しないと想定)、従来の MaxEnt アプローチが適用されます。 値が 1 の場合、モデルによってそれぞれの存在と背景ポイントに均等にペナルティが適用され、ロジスティック回帰と同じようになります。
    • 不在として扱われ、指定された存在ポイントに均等に重み付けされる背景ポイントをツールが生成するため、存在のみモード ([背景ポイントを含む] パラメーターがオフ) を使用する際は値 1 を注意して使用する必要があります。

  • サンプリング バイアスはほとんどの存在データにあり、分析の結果に影響します。 [空間間引き] パラメーターを使用してこの影響を軽減できます。 空間間引きはサンプリング バイアスの影響を軽減するうえで有効な対策ですが、サンプリング バイアスの影響を最小限に抑えるには構造化された調査のデータを使用することをおすすめします。

  • 分類診断はジオプロセシング メッセージ、および [出力トレーニング済みフィーチャ] パラメーター値の結果レイヤーとともに提供される [分類結果のパーセンテージ] チャートから利用できます。 チャートには観測された分類と予測された分類の比較が表示され、既知の存在ポイントのパフォーマンスを予測するモデルの能力を評価するのに使用できます。 たとえば、トレーニング入力ポイント フィーチャで間違って分類された存在ポイントの一部に注目することで、存在を予測するモデルの能力を評価できます。 背景ポイントでの存在の予測が重要になるユース ケースでは、存在があると予測されている背景ポイントの表示と選択にもこのチャートを使用できます。

  • ツールは 2 つの方法で使用できます。 候補モデルのトレーニングと評価に使用することも、新しいデータセット全体の存在確率の予測に使用することもできます。

    • 候補モデルのトレーニングと評価 - 出力を指定せずにツールを実行し、ジオプロセシング メッセージに含まれるモデル診断を評価します。 診断結果が適切と思われる場合は、[出力トレーニング済みフィーチャ] パラメーター値を指定し、分類診断チャートを使用してトレーニング データ全体の予測パフォーマンスをさらに評価します。 [出力感度テーブル] および [出力応答曲線テーブル] パラメーターの値に含まれるチャートはトレーニング データの診断指標であり、適切なモデルの調整と検索にも役立ちます。
    • 予測 - [予測出力] パラメーター カテゴリでパラメーターを指定し、 トレーニング データに含まれていない新しいロケーションにモデルを適用します。 [入力予測フィーチャ] と結果の [出力予測フィーチャ] パラメーター値は、予測が必要な新しいポイント ロケーションを表しています。 ポイント フィーチャに加え、[出力予測ラスター] パラメーター値を指定することで予測サーフェスを作成できます。 トレーニング データ (ラスター、フィールド、または距離フィーチャ) で使用されたのと同じ形式で、照合された説明変数とともに予測フィーチャと予測ラスターを使用する必要があります。

  • 空間間引きでは一部の入力ポイント フィーチャが含まれないトレーニング データが生成される場合があります。 空間間引きを使用した場合における、すべてのポイントでのモデルのパフォーマンスをテストするには、[入力ポイント フィーチャ] パラメーターと [入力予測フィーチャ] パラメーターで同じフィーチャクラスを指定します。

  • ツールでは、出力パスで使用されているフィーチャ データセットの座標系を優先することで、出力の座標系を指定します。 それ以外の場合、ツールは [出力座標系] 環境で指定した座標系を使用します。 フィーチャ データセットか環境設定を指定しなかった場合、ツールでは各出力に次のアプローチを使用します。

    • [出力トレーニング フィーチャ][出力トレーニング ラスター] パラメーター値では、ツールは [入力ポイント フィーチャ] パラメーター値の座標系を使用します。
    • [出力予測フィーチャ] パラメーター値では、ツールは [入力予測フィーチャ] パラメーター値の座標系を使用します。
    • [出力予測ラスター] パラメーター値では、ツールは [出力予測フィーチャ] パラメーター値で定義されている座標系を使用します。 出力予測フィーチャが指定されていない場合、ツールは [説明ラスターの照合] パラメーターで指定された最初のラスターの座標系を使用します。

  • [説明変数の展開 (基底関数)] パラメーター オプションには制限があります。 [Smoothed step (Hinge)] オプションと [Discrete step (Threshold)] オプションは同時に使用できず、どちらかを選択するともう一方を選択することができません。 説明変数を [カテゴリ] として指定した場合、[Original (Linear)] オプションだけが使用されます。

  • [リサンプリング スキーマ] パラメーターを [ランダム] に設定すると、このツールは、データをグループ化し、グループ化されたデータのサブセットに対してモデルのパフォーマンスの整合チェックを実行します。 各トレーニング グループは、幅広い用途のモデルの同じデータ要件の対象となります。つまり、少なくとも 2 つの存在ポイントと 2 つの背景ポイントが必要です。 10 回試行しても、これらの要件が満たされない場合、このツールは交差検証の試行を中止し、交差検証を実行できなかったことを示す警告が表示されます。

パラメーター

ラベル説明データ タイプ
入力ポイント フィーチャ

対象の現象の存在が発生することが既知である場所を表すポイント フィーチャ。

Feature Layer
背景ポイントを含む
(オプション)

入力ポイント フィーチャに背景ポイントが含まれているかどうかを指定します。

入力ポイントに背景ポイントが含まれていない場合、ツールは説明トレーニング ラスターのセルを使用して背景ポイントを生成します。 ツールは背景ポイントを使用して未知の場所の地形の特徴をモデル化し、それを既知の存在場所の地形の特徴と比較します。 そのため、背景ポイントは分析範囲と見なすことができます。 通常、これらは対象の現象の存在が未知である場所です。 ただし、背景ポイントに関する情報が既知である場合、[存在から背景までの相対ウェイト] パラメーターを使用してこれを示すことができます。

  • オン - 入力ポイント フィーチャに背景ポイントが含まれます。
  • オフ - 入力ポイント フィーチャに背景ポイントが含まれません。 これがデフォルトです。
Boolean
存在インジケーター フィールド
(オプション)

各ポイントを存在 (1) か背景 (0) として表すバイナリ値を含む入力ポイント フィーチャのフィールド。 このフィールドの値は数値でなければなりません。

Field
説明トレーニング変数
(オプション)

存在の確率の予測に役立つ説明変数を表すフィールドのリスト。 各変数をカテゴリと数値のどちらにするかを指定できます。 クラスまたはカテゴリを表す各変数 (土地被覆など) で [カテゴリ] チェックボックスをオンにします。

Value Table
説明トレーニング距離フィーチャ
(オプション)

入力ポイント フィーチャから最も近い指定された距離フィーチャまでの距離を表す説明変数を自動作成するのに使用される、フィーチャ レイヤーまたはフィーチャクラスのリスト。 入力説明トレーニング距離フィーチャがポリゴンまたはラインの場合、距離の属性は、最も近いセグメントとポイントの間の距離として計算されます。

Feature Layer
説明トレーニング ラスター
(オプション)

値がラスターから抽出されるモデルで説明トレーニング変数を自動的に作成するのに使用されるラスターのリスト。 入力ポイント フィーチャのフィーチャ (存在と背景ポイント) ごとに、該当するロケーションでラスター セルの値が抽出されます。

連続ラスターからラスター値を抽出する場合には、共一次内挿法によるラスターのリサンプリングが使用されます。 カテゴリ ラスターからラスター値を抽出する場合には、最近隣内挿法による近接割り当てが使用されます。

各ラスター値をカテゴリと数値のどちらにするかを指定できます。 クラスまたはカテゴリを表す各ラスター (土地被覆など) で [カテゴリ] チェックボックスをオンにします。

Value Table
説明変数の展開 (基底関数)
(オプション)

モデルで使用するために、指定された説明変数を変換するのに使用される基底関数を指定します。 基底関数を複数選択した場合、変換された変数がツールによって複数生成され、モデルでそれらの使用が試みられます。

  • Original (Linear)入力変数に対するリニア変換が適用されます。 これがデフォルトです。
  • Pairwise interaction (Product)連続説明変数のペアワイズ乗算が使用され、相互変数が生成されます。 このオプションは、説明変数を複数指定した場合のみ使用できます。
  • Smoothed step (Hinge)連続説明変数値は、静的セグメント (0 または 1 で構成) とリニア関数セグメント (増加または減少) の 2 つのセグメントに変換されます。
  • Discrete step (Threshold)連続説明変数値は 0 と 1 から成るバイナリ変数に変換されます。
  • Squared (Quadratic)各連続説明変数値の二乗が返されます。
String
ノット数
(オプション)

ヒンジおよび閾値説明変数の展開で使用されるノット数。 この値は作成される閾値の数を制御し、各閾値を使って複数の説明変数展開を作成するのに使用されます。 値は 2 ~ 50 の間にする必要があります。 デフォルトは 10 です。

Long
分析範囲
(オプション)

入力ポイント フィーチャに背景ポイントが含まれていない場合に、存在が可能な場所を定義するのに使用される分析範囲のタイプを指定します。

  • 凸包入力ポイント フィーチャのすべての存在ポイントを囲む最小の凸面ポリゴンが使用されます。 これがデフォルトです。
  • ラスター範囲説明トレーニング ラスターの交差点の範囲が使用されます。
  • ポリゴン分析範囲ポリゴン フィーチャクラスで定義したカスタム分析範囲が使用されます。
String
分析範囲のポリゴン
(オプション)

カスタム分析範囲を定義するポリゴンを含むフィーチャクラス。 入力ポイント フィーチャは、ポリゴン フィーチャで覆われたカスタム分析範囲内にロケーションしている必要があります。 分析範囲は複数のポリゴンで構成されている場合があります。

Feature Layer
空間間引きの適用
(オプション)

モデルをトレーニングする前に、存在と背景ポイントに空間間引きを適用するかどうかを指定します。

ポイントを削除し、残りのポイントが [最小最近隣] パラメーターで設定されている最小最近隣距離になるようにすることで、空間間引きはサンプリング バイアスの影響を軽減します。 入力ポイント フィーチャで提供されているか、ツールによって生成されたかに関係なく、空間間引きは背景ポイントにも適用されます。

  • オン - 空間間引きが適用されます。
  • オフ - 空間間引きは適用されません。 これがデフォルトです。
Boolean
最小最近隣距離
(オプション)

空間間引きが適用される際の、任意の 2 つの存在ポイント、または任意の 2 つの背景ポイントの間の最小距離。

Linear Unit
間引きの処理の反復回数
(オプション)

最適空間間引きの解を見つけるために使用される実行回数です。できるだけ多くの存在ポイントと背景ポイントを維持することを目指しながら、指定した [最小最近隣距離] パラメーター値内に存在ポイントまたは背景ポイントが 2 つ存在しないようにします。 使用できる最小反復回数は 1、最大反復回数は 50 です。 デフォルトは 10 です。

このパラメーターは、入力ポイント フィーチャ内の存在ポイントと背景ポイントに適用された空間間引きにのみ使用できます。 ラスター セルから生成された背景ポイントに適用された空間間引きは、最適な解を見つけるために反復処理を行わなくても、[最小最近隣距離] パラメーター値に指定された値にラスター セルをリサンプリングすることで実行されます。

Long
存在から背景までの相対ウェイト
(オプション)

存在ポイントから背景ポイントまでの相対情報ウェイトを指定する、1 ~ 100 までの値。 デフォルトは 100 です。

値が高いほど、存在ポイントがメインの情報源であることを示しています。背景ポイントが存在または不在を表すのかは不明で、モデルでの背景ポイントの重み付けは低くなります。 値が低いほど、背景ポイントは存在ポイントとともに使用できる有用な情報にも寄与します。背景ポイントが不在を表し、その情報をモデルで不在場所として使用できるという信頼度が高くなります。

Long
存在確率変換 (リンク関数)
(オプション)

モデルの境界のない出力を 0 ~ 1 の数字に変換する関数を指定します。 この値は、ロケーションの存在確率として解釈できます。 各オプションは同じ連続値を別の確率に変換します。

  • C-log-logC-log-log リンク関数は、予測を確率に変換するために使用されます。 現象の存在と場所が一義的 (移住しない植物種の存在のモデリングなど) な場合にこのオプションが推奨されます。 これがデフォルトです。
  • ロジスティックロジスティック リンク関数は、予測を確率に変換するために使用されます。 現象の存在と場所が多義的 (移住動物種の存在のモデリングなど) な場合にこのオプションが推奨されます。
String
存在確率のカットオフ
(オプション)

どの確率が生成される分類の存在と一致するかを確立する、0.01 ~ 0.99 の範囲のカットオフ値。 カットオフ値は、トレーニング データと既知の存在ポイントを使用してモデルのパフォーマンスを評価するのに使用されます。 ジオプロセシング メッセージと出力トレーニング済みフィーチャに分類診断が表示されます。

Double
出力トレーニング済みフィーチャ
(オプション)

モデルのトレーニングに使用されるすべてのフィーチャと説明変数を含む出力フィーチャクラス。

Feature Class
出力トレーニング済みラスター
(オプション)

選択したリンク関数を使用して存在確率を示したセル値がある出力ラスター。 デフォルトのセル サイズは、説明トレーニング ラスターの最大セル サイズになります。 入力ポイント フィーチャに背景ポイントがない場合のみ、出力トレーニング済みラスターを作成できます。

Raster Dataset
出力応答曲線テーブル
(オプション)

モデルの他のすべての説明変数の平均的な影響を考慮した後の、存在確率に対する各説明変数の影響を示すトレーニング モデルの診断を含む出力テーブル。

テーブルには最大で 2 つの部分依存プロットの派生チャートが含まれます。1 つが連続変数のライン チャートのセットで、もう 1 つがカテゴリ変数のバー チャートのセットです。

Table
出力感度テーブル
(オプション)

存在確率のカットオフが 0 から 1 に変化する際のトレーニング モデルの正確度の診断を含む出力テーブル。

Table
入力予測フィーチャ
(オプション)

予測が行われるロケーションを表すフィーチャクラス。 入力ポイント フィーチャから使用された、指定された説明変数フィールドがフィーチャクラスに含まれている必要があります。

空間間引きを使用する際、元の入力ポイント フィーチャを入力予測フィーチャとして使用して、データセット全体の予測を受け取ることができます。

Feature Layer
出力予測フィーチャ
(オプション)

入力予測フィーチャに適用される予測モデルの結果を含む出力フィーチャクラス。

Feature Class
出力予測ラスター
(オプション)

照合した説明ラスターの各セルの予測結果を含む出力ラスター。 デフォルトのセル サイズは、説明トレーニング ラスターの最大セル サイズになります。

Raster Dataset
説明変数の照合
(オプション)

入力ポイント フィーチャと入力予測フィーチャの照合予測変数。

Value Table
距離フィーチャの照合
(オプション)

トレーニングと予測の照合距離フィーチャ。

Value Table
説明ラスターの照合
(オプション)

トレーニングと予測の照合ラスター。

Value Table
データ範囲外の予測を許可
(オプション)

トレーニングで使用される値の範囲外に説明変数値がある場合に、外挿を予測で許可するかどうかを指定します。

  • オン - トレーニングで使用される値の範囲外にある外挿を予測で許可します。 これがデフォルトです。
  • オフ - トレーニングで使用される値の範囲外にある外挿を予測で許可しません。
Boolean
リサンプリング スキーマ
(オプション)

予測モデルの交差検証の実施に使用される方法を指定します。 交差検証ではモデルのトレーニング中にデータの一部を対象から除外し、トレーニングが終了したらモデルのパフォーマンスのテストにそれを使用します。

  • なし交差検証は実施されません。 これがデフォルトです。
  • ランダムポイントはグループにランダムに分割され、交差検証の実施時に各グループが一度除外されます。 グループ数は [グループ数] パラメーターで指定します。
String
グループ数
(オプション)

ランダム リサンプリング スキーマの交差検証で使用されるグループ数。 出力トレーニング済みフィーチャのフィールドは、各ポイントが割り当てられたグループを表します。 デフォルトは 3 です。 許可されている最小グループ数は 2、最大グループ数は 10 です。

Long
出力トレーニング済みモデル ファイル
(オプション)

後から予測に使用できるトレーニング済みモデルが保存される出力モデル ファイル。

File

arcpy.stats.PresenceOnlyPrediction(input_point_features, {contains_background}, {presence_indicator_field}, {explanatory_variables}, {distance_features}, {explanatory_rasters}, {basis_expansion_functions}, {number_knots}, {study_area_type}, {study_area_polygon}, {spatial_thinning}, {thinning_distance_band}, {number_of_iterations}, {relative_weight}, {link_function}, {presence_probability_cutoff}, {output_trained_features}, {output_trained_raster}, {output_response_curve_table}, {output_sensitivity_table}, {features_to_predict}, {output_pred_features}, {output_pred_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching}, {allow_predictions_outside_of_data_ranges}, {resampling_scheme}, {number_of_groups}, {output_trained_model})
名前説明データ タイプ
input_point_features

対象の現象の存在が発生することが既知である場所を表すポイント フィーチャ。

Feature Layer
contains_background
(オプション)

入力ポイント フィーチャに背景ポイントが含まれているかどうかを指定します。

入力ポイントに背景ポイントが含まれていない場合、ツールは説明トレーニング ラスターのセルを使用して背景ポイントを生成します。 ツールは背景ポイントを使用して未知の場所の地形の特徴をモデル化し、それを既知の存在場所の地形の特徴と比較します。 そのため、背景ポイントは分析範囲と見なすことができます。 通常、これらは対象の現象の存在が未知である場所です。 ただし、背景ポイントに関する情報が既知である場合、「relative_weight」パラメーターを使用してこれを示すことができます。

  • PRESENCE_AND_BACKGROUND_POINTS入力ポイント フィーチャに背景ポイントが含まれます。
  • PRESENCE_ONLY_POINTS入力ポイント フィーチャに背景ポイントが含まれません。 これがデフォルトです。
Boolean
presence_indicator_field
(オプション)

各ポイントを存在 (1) か背景 (0) として表すバイナリ値を含む入力ポイント フィーチャのフィールド。 このフィールドの値は数値でなければなりません。

Field
explanatory_variables
[[Variable, Categorical],...]
(オプション)

存在の確率の予測に役立つ説明変数を表すフィールドのリスト。 各変数をカテゴリと数値のどちらにするかを指定できます。 クラスまたはカテゴリを表す各変数 (土地被覆など) で「CATEGORICAL」オプションを指定します。

Value Table
distance_features
[distance_features,...]
(オプション)

入力ポイント フィーチャから最も近い指定された距離フィーチャまでの距離を表す説明変数を自動作成するのに使用される、フィーチャ レイヤーまたはフィーチャクラスのリスト。 入力説明トレーニング距離フィーチャがポリゴンまたはラインの場合、距離の属性は、最も近いセグメントとポイントの間の距離として計算されます。

Feature Layer
explanatory_rasters
[[Variable, Categorical],...]
(オプション)

値がラスターから抽出されるモデルで説明トレーニング変数を自動的に作成するのに使用されるラスターのリスト。 入力ポイント フィーチャのフィーチャ (存在と背景ポイント) ごとに、該当するロケーションでラスター セルの値が抽出されます。

連続ラスターからラスター値を抽出する場合には、共一次内挿法によるラスターのリサンプリングが使用されます。 カテゴリ ラスターからラスター値を抽出する場合には、最近隣内挿法による近接割り当てが使用されます。

各ラスター値をカテゴリと数値のどちらにするかを指定できます。 クラスまたはカテゴリを表す各ラスター (土地被覆など) で「CATEGORICAL」オプションを指定します。

Value Table
basis_expansion_functions
[basis_expansion_functions,...]
(オプション)

モデルで使用するために、指定された説明変数を変換するのに使用される基底関数を指定します。 基底関数を複数選択した場合、変換された変数がツールによって複数生成され、モデルでそれらの使用が試みられます。

  • LINEAR入力変数に対するリニア変換が適用されます。 これがデフォルトです。
  • PRODUCT連続説明変数のペアワイズ乗算が使用され、相互変数が生成されます。 このオプションは、説明変数を複数指定した場合のみ使用できます。
  • HINGE連続説明変数値は、静的セグメント (0 または 1 で構成) とリニア関数セグメント (増加または減少) の 2 つのセグメントに変換されます。
  • THRESHOLD連続説明変数値は 0 と 1 から成るバイナリ変数に変換されます。
  • QUADRATIC各連続説明変数値の二乗が返されます。
String
number_knots
(オプション)

ヒンジおよび閾値説明変数の展開で使用されるノット数。 この値は作成される閾値の数を制御し、各閾値を使って複数の説明変数展開を作成するのに使用されます。 値は 2 ~ 50 の間にする必要があります。 デフォルトは 10 です。

Long
study_area_type
(オプション)

入力ポイント フィーチャに背景ポイントが含まれていない場合に、存在が可能な場所を定義するのに使用される分析範囲のタイプを指定します。

  • CONVEX_HULL入力ポイント フィーチャのすべての存在ポイントを囲む最小の凸面ポリゴンが使用されます。 これがデフォルトです。
  • RASTER_EXTENT説明トレーニング ラスターの交差点の範囲が使用されます。
  • STUDY_POLYGONポリゴン フィーチャクラスで定義したカスタム分析範囲が使用されます。
String
study_area_polygon
(オプション)

カスタム分析範囲を定義するポリゴンを含むフィーチャクラス。 入力ポイント フィーチャは、ポリゴン フィーチャで覆われたカスタム分析範囲内にロケーションしている必要があります。 分析範囲は複数のポリゴンで構成されている場合があります。

Feature Layer
spatial_thinning
(オプション)

モデルをトレーニングする前に、存在と背景ポイントに空間間引きを適用するかどうかを指定します。

ポイントを削除し、残りのポイントが thinning_distance_band パラメーターで設定されている最小最近隣距離になるようにすることで、空間間引きはサンプリング バイアスの影響を軽減します。 入力ポイント フィーチャで提供されているか、ツールによって生成されたかに関係なく、空間間引きは背景ポイントにも適用されます。

  • THINNING空間間引きが適用されます。
  • NO_THINNING空間間引きは適用されません。 これがデフォルトです。
Boolean
thinning_distance_band
(オプション)

空間間引きが適用される際の、任意の 2 つの存在ポイント、または任意の 2 つの背景ポイントの間の最小距離。

Linear Unit
number_of_iterations
(オプション)

最適な空間間引きの解を見つけるために使用される実行回数です。できるだけ多くの存在ポイントと背景ポイントを維持することを目指しながら、指定した thinning_distance_band パラメーター値内に存在ポイントまたは背景ポイントが 2 つ存在しないようにします。 使用できる最小反復回数は 1、最大反復回数は 50 です。 デフォルトは 10 です。

このパラメーターは、入力ポイント フィーチャ内の存在ポイントと背景ポイントに適用された空間間引きにのみ使用できます。 ラスター セルから生成された背景ポイントに適用された空間間引きは、最適な解を見つけるために反復処理を行わなくても、thinning_distance_band パラメーターに指定された値にラスター セルをリサンプリングすることで実行されます。

Long
relative_weight
(オプション)

存在ポイントから背景ポイントまでの相対情報ウェイトを指定する、1 ~ 100 までの値。 デフォルトは 100 です。

値が高いほど、存在ポイントがメインの情報源であることを示しています。背景ポイントが存在または不在を表すのかは不明で、モデルでの背景ポイントの重み付けは低くなります。 値が低いほど、背景ポイントは存在ポイントとともに使用できる有用な情報にも寄与します。背景ポイントが不在を表し、その情報をモデルで不在場所として使用できるという信頼度が高くなります。

Long
link_function
(オプション)

モデルの境界のない出力を 0 ~ 1 の数字に変換する関数を指定します。 この値は、ロケーションの存在確率として解釈できます。 各オプションは同じ連続値を別の確率に変換します。

  • CLOGLOGC-log-log リンク関数は、予測を確率に変換するために使用されます。 現象の存在と場所が一義的 (移住しない植物種の存在のモデリングなど) な場合にこのオプションが推奨されます。 これがデフォルトです。
  • LOGISTICロジスティック リンク関数は、予測を確率に変換するために使用されます。 現象の存在と場所が多義的 (移住動物種の存在のモデリングなど) な場合にこのオプションが推奨されます。
String
presence_probability_cutoff
(オプション)

どの確率が生成される分類の存在と一致するかを確立する、0.01 ~ 0.99 の範囲のカットオフ値。 カットオフ値は、トレーニング データと既知の存在ポイントを使用してモデルのパフォーマンスを評価するのに使用されます。 ジオプロセシング メッセージと出力トレーニング済みフィーチャに分類診断が表示されます。

Double
output_trained_features
(オプション)

モデルのトレーニングに使用されるすべてのフィーチャと説明変数を含む出力フィーチャクラス。

Feature Class
output_trained_raster
(オプション)

選択したリンク関数を使用して存在確率を示したセル値がある出力ラスター。 デフォルトのセル サイズは、説明トレーニング ラスターの最大セル サイズになります。 入力ポイント フィーチャに背景ポイントがない場合のみ、出力トレーニング済みラスターを作成できます。

Raster Dataset
output_response_curve_table
(オプション)

モデルの他のすべての説明変数の平均的な影響を考慮した後の、存在確率に対する各説明変数の影響を示すトレーニング モデルの診断を含む出力テーブル。

テーブルには最大で 2 つの部分依存プロットの派生チャートが含まれます。1 つが連続変数のライン チャートのセットで、もう 1 つがカテゴリ変数のバー チャートのセットです。

Table
output_sensitivity_table
(オプション)

存在確率のカットオフが 0 から 1 に変化する際のトレーニング モデルの正確度の診断を含む出力テーブル。

Table
features_to_predict
(オプション)

予測が行われるロケーションを表すフィーチャクラス。 入力ポイント フィーチャから使用された、指定された説明変数フィールドがフィーチャクラスに含まれている必要があります。

空間間引きを使用する際、元の入力ポイント フィーチャを入力予測フィーチャとして使用して、データセット全体の予測を受け取ることができます。

Feature Layer
output_pred_features
(オプション)

入力予測フィーチャに適用される予測モデルの結果を含む出力フィーチャクラス。

Feature Class
output_pred_raster
(オプション)

照合した説明ラスターの各セルの予測結果を含む出力ラスター。 デフォルトのセル サイズは、説明トレーニング ラスターの最大セル サイズになります。

Raster Dataset
explanatory_variable_matching
[[Prediction, Training],...]
(オプション)

入力ポイント フィーチャと入力予測フィーチャの照合予測変数。

Value Table
explanatory_distance_matching
[[Prediction, Training],...]
(オプション)

トレーニングと予測の照合距離フィーチャ。

Value Table
explanatory_rasters_matching
[[Prediction, Training],...]
(オプション)

トレーニングと予測の照合ラスター。

Value Table
allow_predictions_outside_of_data_ranges
(オプション)
  • ALLOWEDトレーニングで使用される値の範囲外にある外挿を予測で許可します。 これがデフォルトです。
  • NOT_ALLOWEDトレーニングで使用される値の範囲外にある外挿を予測で許可しません。
Boolean
resampling_scheme
(オプション)

予測モデルの交差検証の実施に使用される方法を指定します。 交差検証ではモデルのトレーニング中にデータの一部を対象から除外し、トレーニングが終了したらモデルのパフォーマンスのテストにそれを使用します。

  • NONE交差検証は実施されません。 これがデフォルトです。
  • RANDOMポイントはグループにランダムに分割され、交差検証の実施時に各グループが一度除外されます。 グループ数は number_of_groups パラメーターで指定します。
String
number_of_groups
(オプション)

ランダム リサンプリング スキーマの交差検証で使用されるグループ数。 出力トレーニング済みフィーチャのフィールドは、各ポイントが割り当てられたグループを表します。 デフォルトは 3 です。 許可されている最小グループ数は 2、最大グループ数は 10 です。

Long
output_trained_model
(オプション)

後から予測に使用できるトレーニング済みモデルが保存される出力モデル ファイル。

File

コードのサンプル

PresenceOnlyPrediction の例 1 (Python ウィンドウ)

次の Python スクリプトは、PresenceOnlyPrediction 関数の使用方法を示しています。


# Import system modules 
import arcpy 

# Call Presence-only Prediction (MaxEnt)
arcpy.stats.PresenceOnlyPrediction(
    input_point_features=r"C:\MyData.gdb\Presence_Points", 
    contains_background="PRESENCE_ONLY_POINTS",
    presence_indicator_field=None,
    explanatory_variables=None,
    distance_features=None,
    explanatory_rasters=[[r"C:\MyData.gdb\Elevation", "false"], 
                         [r"C:\MyData.gdb\Canopy", "false"], 
                         [r"C:\MyData.gdb\ClimacticWaterDeficit", "false"], 
                         [r"C:\MyData.gdb\LandCoverClassification", "true"], 
                         [r"C:\MyData.gdb\UpperSlope", "false"],
                         [r"C:\MyData.gdb\LowerSlope", "false"]], 
    basis_expansion_functions="LINEAR;QUADRATIC;PRODUCT;HINGE",
    number_knots=10,
    study_area_type="CONVEX_HULL",
    study_area_polygon=None,
    spatial_thinning="THINNING",
    thinning_distance_band="500 Meters", 
    number_of_iterations=10
    relative_weight=100
    link_function="CLOGLOG"
    presence_probability_cutoff=0.5
    output_trained_features=r"C:\MyData.gdb\Out_Trained_Features"
    output_trained_raster=r"C:\MyData.gdb\Out_Trained_Raster"
    output_response_curve_table=r"C:\MyData.gdb\Out_Response_Curve_Table"
    output_sensitivity_table=r"C:\MyData.gdb\Out_Sensitivity_Table"
    features_to_predict=r"C:\MyData.gdb\In_Prediction_Features"
    output_pred_features=r"C:\MyData.gdb\Out_Prediction_Features"
    output_pred_raster=r"C:\MyData.gdb\Out_Prediction_Raster",
    explanatory_variable_matching=None
    explanatory_distance_matching=None
    explanatory_rasters_matching=[[r"C:\MyData.gdb\Prediction_Elevation", "false"], 
                                  [r"C:\MyData.gdb\Prediction_Canopy", "false"], 
                                  [r"C:\MyData.gdb\Prediction_ClimacticWaterDeficit", "false"], 
                                  [r"C:\MyData.gdb\Prediction_LandCoverClassification", "true"], 
                                  [r"C:\MyData.gdb\Prediction_UpperSlope", "false"],
                                  [r"C:\MyData.gdb\Prediction_LowerSlope", "false"]], 
    allow_predictions_outside_of_data_ranges="ALLOWED"
    resampling_scheme="RANDOM"
    number_of_groups=3)
PresenceOnlyPrediction の例 2 (スタンドアロン スクリプト)

次の Python スクリプトは、PresenceOnlyPrediction 関数の使用方法を示しています。


# This example is a simple run of the tool using presence-only points and 
# explanatory training rasters to train an initial model. No outputs are 
# specified, as the intent is to interrogate geoprocessing messages to gain 
# an initial sense of model performance. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_ONLY_POINTS”
    
    # Set the explanatory Training variables, using only explanatory rasters
    # Note the categorical setting for the LandCoverClassification raster
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    
    # Set basis functions, adding quadratic to use the square of each variable
    basis_functions = "LINEAR;QUADRATIC"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_rasters=explanatory_rasters,
        basis_expansion_functions=basis_functions,
        study_area_type=study_area_type,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)
PresenceOnlyPrediction の例 3 (スタンドアロン スクリプト)

次の Python スクリプトは、PresenceOnlyPrediction 関数の使用方法を示しています。


# This example uses presence and background points and explanatory 
# variables from rasters, fields, and distance features to train a 
# model, using additional parameters to apply basis functions, use 
# spatial thinning, perform cross-validation, and receive diagnostic 
# training outputs. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 

    ### MODEL INPUTS ###
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_AND_BACKGROUND_POINTS
    presence_indicator_field = "Presence"
    
    # Set the explanatory Training variables
    explanatory_fields = [["Survey_Region", "true"], 
                          ["Temperature", "false"], 
                          ["Humidity", "false"]]
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    explanatory_dist_features = [["Streams", "false"], 
                                 ["Lakes", "false"], 
                                 ["Roads", "false"]]                           
    
    ### MODEL CONFIGURATION ###

    # Set basis functions
    basis_functions = "LINEAR;QUADRATIC;PRODUCT;HINGE"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None

    # Set spatial thinning 
    spatial_thinning = "THINNING"
    min_nearest_neighbor_distance = "500 Meters"
    number_of_iterations = 10

    # Set the relative weight of presence to background and link function, using
    # background points as observed absence
    relative_weight = 1
    link_function = "LOGISTIC"

    # Set the presence probability cutoff
    cutoff = 0.3

    ### MODEL OUTPUTS AND VALIDATION ###

    # Set training outputs for model evaluation
    out_trained_features = "Out_Trained_Features"
    out_trained_raster = "Out_Trained_Raster"
    out_response_curve_table = "Out_Response_Curves"
    out_sensitivity_table = "Out_Sensitivity_Table"
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_variables=explanatory_fields,
        explanatory_rasters=explanatory_rasters,
        distance_features=explanatory_dist_features,
        basis_expansion_functions=basis_functions,
        number_knots=number_knots,
        study_area_type=study_area_type,
        spatial_thinning=spatial_thinning,
        thinning_distance_band=min_nearest_neighbor_distance,
        number_of_iterations=number_of_iterations,
        relative_weight=relative_weight,
        link_function=link_function,
        presence_probability_cutoff=cutoff,
        output_trained_features=out_trained_features,
        output_trained_raster=out_trained_raster,
        output_response_curve_table=out_response_curve_table,
        output_sensitivity_table=out_sensitivity_table,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)

環境

特殊なケース

並列処理ファクター

並列処理は、予測を作成するときのみ使用されます。

乱数ジェネレーター

メルセンヌ ツイスター乱数ジェネレーターが常に使用されます。