ローカル 2 変数リレーションシップ (Local Bivariate Relationships) (空間統計)

サマリー

ローカル エントロピーを使用して、2 つの変数の統計的に有意な関係を解析します。 各フィーチャは、関係性のタイプに基づいて、6 つのカテゴリのいずれかに分類されます。 出力を使用して、変数が関係するエリアを視覚化し、分析範囲全体で関係がどのように変化するかを調べることができます。

[ローカル 2 変数リレーションシップ (Local Bivariate Relationships)] ツールの詳細

ローカル 2 変数リレーションシップ ツールの図
2 つの変数間の局所的な関係を検出し、視覚化します。

使用法

  • このツールは入力としてポイントとポリゴンを受け取り、連続変数で使用する必要があります。 バイナリ データやカテゴリ データには、適していません。

  • 出力フィーチャは、シェープファイル (.shp) としてではなくジオデータベースに保存することをお勧めします。 シェープファイルは属性に NULL 値を保存できず、ポップアップ ダイアログ ボックスにチャートを保存できません。

  • それぞれの入力フィーチャは、[説明変数] パラメーターが [従属変数] パラメーターの値を予測できる確実性に基づいて、次の関係性カテゴリのいずれかに分類されます。

    • [有意でない] - 変数間の関係は統計的に有意ではありません。
    • [正の線形] - 説明変数が増加するに伴い、従属変数が線形に増加します。
    • [負の線形] - 説明変数が増加するに伴い、従属変数が線形に減少します。
    • [凹面] - 説明変数が増加するに伴い、従属変数が凹状曲線に沿って変化します。
    • [凸面] - 説明変数が増加するに伴い、従属変数が凸状曲線に沿って変化します。
    • [未定義の複素数] - 変数に有意な関係がありますが、関係のタイプをその他すべてのカテゴリのいずれでも高い信頼性で説明できません。

  • 2 つの変数間に関係性があるかどうかは、どちらが説明変数で、どちらが従属変数であるかに依存しません。 たとえば、糖尿病が肥満と関係していれば、肥満も同様に糖尿病と関係しています。 ただし、関係性のタイプの分類は、どちらを説明変数にして、どちらを従属変数にするかによって変化する場合があります。 1 つ目の変数が 2 つ目の変数を正確に予測できても、2 つ目の変数が 1 つ目の変数を正確に予測できない可能性があります。 どちらの変数に説明変数と従属変数のラベルを付けるかわからない場合は、ツールを 2 回実行して、両方試してください。

  • このツールは並列処理をサポートしており、デフォルトで利用可能なプロセッサの 50 パーセントを使用します。 プロセッサの数を増減するには、並列処理ファクター環境を使用します。

パラメーター

ラベル説明データ タイプ
入力フィーチャ

[従属変数][説明変数] の値を表すフィールドを含むフィーチャクラス。

Feature Layer
従属変数

従属変数の値を表す数値フィールド。 関係性を分類するとき、[説明変数] の値は [従属変数] の値を予測するために使用されます。

Field
説明変数

説明変数の値を表す数値フィールド。 関係性を分類するとき、[説明変数] の値は [従属変数] の値を予測するために使用されます。

Field
出力フィーチャ

[従属変数] の値と [説明変数] の値を表すフィールドを含むすべての入力フィーチャ、エントロピー スコア、疑似 p 値、有意水準、分類された関係性のタイプ、分類に関係する診断を含む出力フィーチャクラス。

Feature Class
近傍数
(オプション)

変数間の局所的な関係のテストに使用される各フィーチャの周囲の近傍数 (フィーチャを含む)。 近傍数は 30 ~ 1000 の範囲である必要があり、デフォルトは 30 です。 指定する値は、フィーチャ間の関係を検出できるほど大きく、局所的なパターンを識別できるほど小さい必要があります。

Long
順列の数
(オプション)

各フィーチャの疑似 p 値の計算に使用される順列の数を指定します。 順列の数を選択する場合は、疑似 p 値の精度と処理時間の増加とのバランスを考慮します。

  • 99 順列順列の数が 99 の場合、許容最小疑似 p 値は 0.01 で、その他すべての疑似 p 値は、この値の倍になります。
  • 199 順列順列の数が 199 の場合、許容最小疑似 p 値は 0.005 で、その他すべての疑似 p 値は、この値の倍になります。 これがデフォルトです。
  • 499 順列順列の数が 499 の場合、許容最小疑似 p 値は 0.002 で、その他すべての疑似 p 値は、この値の倍になります。
  • 999 順列順列の数が 999 の場合、許容最小疑似 p 値は 0.001 で、その他すべての疑似 p 値は、この値の倍になります。
Long
ローカル散布図ポップアップの有効化
(オプション)

各出力フィーチャに散布図ポップアップを生成するかどうかを指定します。 それぞれの散布図には、ローカル近傍内にある説明変数の値 (横軸) と従属変数の値 (縦軸) と、関係性を視覚化する滑らかな直線または曲線が表示されます。 散布図チャートは、シェープファイル出力ではサポートされていません。

  • オン - データセット内の各フィーチャに対して、ローカル散布図ポップアップが生成されます。 これがデフォルトです。
  • オフ - ローカル散布図ポップアップは生成されません。
Boolean
信頼度
(オプション)

優位な関係性に対する仮説検定の信頼度を指定します。

  • 90%信頼度は 90 パーセントです。 これがデフォルトです。
  • 95%信頼度は 95 パーセントです。
  • 99%信頼度は 99 パーセントです。
String
FDR (False Discovery Rate) 補正の適用
(オプション)

FDR (False Discover Rate) 補正を疑似 p 値に適用するかどうかを指定します。

  • オン - 統計的な有意性は、FDR 補正を使用します。 これがデフォルトです。
  • オン - 統計的な有意性は、疑似 p 値を使用します。
Boolean
縮尺係数 (アルファ)
(オプション)

変数間のわずかな関係性に対する感度のレベル。 大きな値 (1 に近い値) は相対的に弱い関係性を検出できます。小さな値 (0 に近い値) は強い関係性のみを検出します。 小さな値は、外れ値に対してより頑健です。 値は 0.01 ~ 1 の範囲である必要があり、デフォルトは 0.5 です。

Double

arcpy.stats.LocalBivariateRelationships(in_features, dependent_variable, explanatory_variable, output_features, {number_of_neighbors}, {number_of_permutations}, {enable_local_scatterplot_popups}, {level_of_confidence}, {apply_false_discovery_rate_fdr_correction}, {scaling_factor})
名前説明データ タイプ
in_features

dependent_variableexplanatory_variable の値を表すフィールドを含むフィーチャクラス。

Feature Layer
dependent_variable

従属変数の値を表す数値フィールド。 関係性を分類するとき、explanatory_variable の値は dependent_variable の値を予測するために使用されます。

Field
explanatory_variable

説明変数の値を表す数値フィールド。 関係性を分類するとき、explanatory_variable の値は dependent_variable の値を予測するために使用されます。

Field
output_features

dependent_variable の値と explanatory_variable の値を表すフィールドを含むすべての入力フィーチャ、エントロピー スコア、疑似 p 値、有意水準、分類された関係性のタイプ、分類に関係する診断を含む出力フィーチャクラス。

Feature Class
number_of_neighbors
(オプション)

変数間の局所的な関係のテストに使用される各フィーチャの周囲の近傍数 (フィーチャを含む)。 近傍数は 30 ~ 1000 の範囲である必要があり、デフォルトは 30 です。 指定する値は、フィーチャ間の関係を検出できるほど大きく、局所的なパターンを識別できるほど小さい必要があります。

Long
number_of_permutations
(オプション)

各フィーチャの疑似 p 値の計算に使用される順列の数を指定します。 順列の数を選択する場合は、疑似 p 値の精度と処理時間の増加とのバランスを考慮します。

  • 99順列の数が 99 の場合、許容最小疑似 p 値は 0.01 で、その他すべての疑似 p 値は、この値の倍になります。
  • 199順列の数が 199 の場合、許容最小疑似 p 値は 0.005 で、その他すべての疑似 p 値は、この値の倍になります。 これがデフォルトです。
  • 499順列の数が 499 の場合、許容最小疑似 p 値は 0.002 で、その他すべての疑似 p 値は、この値の倍になります。
  • 999順列の数が 999 の場合、許容最小疑似 p 値は 0.001 で、その他すべての疑似 p 値は、この値の倍になります。
Long
enable_local_scatterplot_popups
(オプション)

各出力フィーチャに散布図ポップアップを生成するかどうかを指定します。 それぞれの散布図には、ローカル近傍内にある説明変数の値 (横軸) と従属変数の値 (縦軸) と、関係性を視覚化する滑らかな直線または曲線が表示されます。 散布図チャートは、シェープファイル出力ではサポートされていません。

  • CREATE_POPUPデータセット内の各フィーチャに対して、ローカル散布図ポップアップが生成されます。 これがデフォルトです。
  • NO_POPUPローカル散布図ポップアップは生成されません。
Boolean
level_of_confidence
(オプション)

優位な関係性に対する仮説検定の信頼度を指定します。

  • 90%信頼度は 90 パーセントです。 これがデフォルトです。
  • 95%信頼度は 95 パーセントです。
  • 99%信頼度は 99 パーセントです。
String
apply_false_discovery_rate_fdr_correction
(オプション)

FDR (False Discover Rate) 補正を疑似 p 値に適用するかどうかを指定します。

  • APPLY_FDR統計的な有意性は、FDR 補正を使用します。 これがデフォルトです。
  • NO_FDR統計的な有意性は、疑似 p 値を使用します。
Boolean
scaling_factor
(オプション)

変数間のわずかな関係性に対する感度のレベル。 大きな値 (1 に近い値) は相対的に弱い関係性を検出できます。小さな値 (0 に近い値) は強い関係性のみを検出します。 小さな値は、外れ値に対してより頑健です。 値は 0.01 ~ 1 の範囲である必要があり、デフォルトは 0.5 です。

Double

コードのサンプル

LocalBivariateRelationships の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、LocalBivariateRelationships 関数の使用方法を示しています。

import arcpy
arcpy.env.workspace = 'C:\\LBR\\MyData.gdb'
arcpy.stats.LocalBivariateRelationships('ObesityDiabetes', 'ObesityRate', 
                   'DiabetesRate','LBR_Results', 30, '199', 'CREATE_POPUP', 
                   '95%', 'APPLY_FDR', 0.5)
LocalBivariateRelationships の例 2 (スタンドアロン スクリプト)

次のスタンドアロン Python スクリプトは、LocalBivariateRelationships 関数の使用方法を示しています。

# Use the Local Bivariate Relationships tool to study the relationship between
# obesity and diabetes.

# Import system modules.
import arcpy
import os

# Set property to overwrite existing output by default.
arcpy.env.overwriteOutput = True

try:
    # Set the workspace and input features.
    arcpy.env.workspace = r"C:\\LBR\\MyData.gdb"
    inputFeatures = 'ObesityDiabetes'

    # Set the output workspace and output name.
    outws = 'C:\\LBR\\outputs.gdb'
    outputName = 'LBR_Results'

    # Set input features, dependent variable, and explanatory variable.
    depVar = 'DiabetesRate'
    explVar = 'ObesityRate'

    # Set number of neighbors and permutations.
    numNeighbors = 50
    numPerms = '999'

    # Choose to create pop-ups.
    popUps = 'CREATE_POPUP'

    # Choose confidence level and apply False Discovery Rate correction.
    confLevel = '95%'
    fdr = 'APPLY_FDR'

    # Set the scaling factor.
    scaleFactor = 0.5

    # Run Local Bivariate Relationships.
    arcpy.stats.LocalBivariateRelationships(inputFeatures, depVar, explVar, 
                                            os.path.join(outws, outputName), 
                                            numNeighbors, numPerms, popUps, 
                                            confLevel, fdr, scaleFactor)

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())