ラベル | 説明 | データ タイプ |
入力フィーチャ | [従属変数] と [説明変数] の値を表すフィールドを含むフィーチャクラス。 | Feature Layer |
従属変数 | 従属変数の値を表す数値フィールド。 関係性を分類するとき、[説明変数] の値は [従属変数] の値を予測するために使用されます。 | Field |
説明変数 | 説明変数の値を表す数値フィールド。 関係性を分類するとき、[説明変数] の値は [従属変数] の値を予測するために使用されます。 | Field |
出力フィーチャ | [従属変数] の値と [説明変数] の値を表すフィールドを含むすべての入力フィーチャ、エントロピー スコア、疑似 p 値、有意水準、分類された関係性のタイプ、分類に関係する診断を含む出力フィーチャクラス。 | Feature Class |
近傍数 (オプション) | 変数間の局所的な関係のテストに使用される各フィーチャの周囲の近傍数 (フィーチャを含む)。 近傍数は 30 ~ 1000 の範囲である必要があり、デフォルトは 30 です。 指定する値は、フィーチャ間の関係を検出できるほど大きく、局所的なパターンを識別できるほど小さい必要があります。 | Long |
順列の数 (オプション) | 各フィーチャの疑似 p 値の計算に使用される順列の数を指定します。 順列の数を選択する場合は、疑似 p 値の精度と処理時間の増加とのバランスを考慮します。
| Long |
ローカル散布図ポップアップの有効化 (オプション) | 各出力フィーチャに散布図ポップアップを生成するかどうかを指定します。 それぞれの散布図には、ローカル近傍内にある説明変数の値 (横軸) と従属変数の値 (縦軸) と、関係性を視覚化する滑らかな直線または曲線が表示されます。 散布図チャートは、シェープファイル出力ではサポートされていません。
| Boolean |
信頼度 (オプション) | 優位な関係性に対する仮説検定の信頼度を指定します。
| String |
FDR (False Discovery Rate) 補正の適用 (オプション) | FDR (False Discover Rate) 補正を疑似 p 値に適用するかどうかを指定します。
| Boolean |
縮尺係数 (アルファ) (オプション) | 変数間のわずかな関係性に対する感度のレベル。 大きな値 (1 に近い値) は相対的に弱い関係性を検出できます。小さな値 (0 に近い値) は強い関係性のみを検出します。 小さな値は、外れ値に対してより頑健です。 値は 0.01 ~ 1 の範囲である必要があり、デフォルトは 0.5 です。 | Double |
サマリー
ローカル エントロピーを使用して、2 つの変数の統計的に有意な関係を解析します。 各フィーチャは、関係性のタイプに基づいて、6 つのカテゴリのいずれかに分類されます。 出力を使用して、変数が関係するエリアを視覚化し、分析範囲全体で関係がどのように変化するかを調べることができます。
図
使用法
このツールは入力としてポイントとポリゴンを受け取り、連続変数で使用する必要があります。 バイナリ データやカテゴリ データには、適していません。
出力フィーチャは、シェープファイル (.shp) としてではなくジオデータベースに保存することをお勧めします。 シェープファイルは属性に NULL 値を保存できず、ポップアップ ダイアログ ボックスにチャートを保存できません。
それぞれの入力フィーチャは、[説明変数] パラメーターが [従属変数] パラメーターの値を予測できる確実性に基づいて、次の関係性カテゴリのいずれかに分類されます。
- [有意でない] - 変数間の関係は統計的に有意ではありません。
- [正の線形] - 説明変数が増加するに伴い、従属変数が線形に増加します。
- [負の線形] - 説明変数が増加するに伴い、従属変数が線形に減少します。
- [凹面] - 説明変数が増加するに伴い、従属変数が凹状曲線に沿って変化します。
- [凸面] - 説明変数が増加するに伴い、従属変数が凸状曲線に沿って変化します。
- [未定義の複素数] - 変数に有意な関係がありますが、関係のタイプをその他すべてのカテゴリのいずれでも高い信頼性で説明できません。
2 つの変数間に関係性があるかどうかは、どちらが説明変数で、どちらが従属変数であるかに依存しません。 たとえば、糖尿病が肥満と関係していれば、肥満も同様に糖尿病と関係しています。 ただし、関係性のタイプの分類は、どちらを説明変数にして、どちらを従属変数にするかによって変化する場合があります。 1 つ目の変数が 2 つ目の変数を正確に予測できても、2 つ目の変数が 1 つ目の変数を正確に予測できない可能性があります。 どちらの変数に説明変数と従属変数のラベルを付けるかわからない場合は、ツールを 2 回実行して、両方試してください。
このツールは並列処理をサポートしており、デフォルトで利用可能なプロセッサの 50 パーセントを使用します。 プロセッサの数を増減するには、並列処理ファクター環境を使用します。
パラメーター
arcpy.stats.LocalBivariateRelationships(in_features, dependent_variable, explanatory_variable, output_features, {number_of_neighbors}, {number_of_permutations}, {enable_local_scatterplot_popups}, {level_of_confidence}, {apply_false_discovery_rate_fdr_correction}, {scaling_factor})
名前 | 説明 | データ タイプ |
in_features | dependent_variable と explanatory_variable の値を表すフィールドを含むフィーチャクラス。 | Feature Layer |
dependent_variable | 従属変数の値を表す数値フィールド。 関係性を分類するとき、explanatory_variable の値は dependent_variable の値を予測するために使用されます。 | Field |
explanatory_variable | 説明変数の値を表す数値フィールド。 関係性を分類するとき、explanatory_variable の値は dependent_variable の値を予測するために使用されます。 | Field |
output_features | dependent_variable の値と explanatory_variable の値を表すフィールドを含むすべての入力フィーチャ、エントロピー スコア、疑似 p 値、有意水準、分類された関係性のタイプ、分類に関係する診断を含む出力フィーチャクラス。 | Feature Class |
number_of_neighbors (オプション) | 変数間の局所的な関係のテストに使用される各フィーチャの周囲の近傍数 (フィーチャを含む)。 近傍数は 30 ~ 1000 の範囲である必要があり、デフォルトは 30 です。 指定する値は、フィーチャ間の関係を検出できるほど大きく、局所的なパターンを識別できるほど小さい必要があります。 | Long |
number_of_permutations (オプション) | 各フィーチャの疑似 p 値の計算に使用される順列の数を指定します。 順列の数を選択する場合は、疑似 p 値の精度と処理時間の増加とのバランスを考慮します。
| Long |
enable_local_scatterplot_popups (オプション) | 各出力フィーチャに散布図ポップアップを生成するかどうかを指定します。 それぞれの散布図には、ローカル近傍内にある説明変数の値 (横軸) と従属変数の値 (縦軸) と、関係性を視覚化する滑らかな直線または曲線が表示されます。 散布図チャートは、シェープファイル出力ではサポートされていません。
| Boolean |
level_of_confidence (オプション) | 優位な関係性に対する仮説検定の信頼度を指定します。
| String |
apply_false_discovery_rate_fdr_correction (オプション) | FDR (False Discover Rate) 補正を疑似 p 値に適用するかどうかを指定します。
| Boolean |
scaling_factor (オプション) | 変数間のわずかな関係性に対する感度のレベル。 大きな値 (1 に近い値) は相対的に弱い関係性を検出できます。小さな値 (0 に近い値) は強い関係性のみを検出します。 小さな値は、外れ値に対してより頑健です。 値は 0.01 ~ 1 の範囲である必要があり、デフォルトは 0.5 です。 | Double |
コードのサンプル
次の Python ウィンドウ スクリプトは、LocalBivariateRelationships 関数の使用方法を示しています。
import arcpy
arcpy.env.workspace = 'C:\\LBR\\MyData.gdb'
arcpy.stats.LocalBivariateRelationships('ObesityDiabetes', 'ObesityRate',
'DiabetesRate','LBR_Results', 30, '199', 'CREATE_POPUP',
'95%', 'APPLY_FDR', 0.5)
次のスタンドアロン Python スクリプトは、LocalBivariateRelationships 関数の使用方法を示しています。
# Use the Local Bivariate Relationships tool to study the relationship between
# obesity and diabetes.
# Import system modules.
import arcpy
import os
# Set property to overwrite existing output by default.
arcpy.env.overwriteOutput = True
try:
# Set the workspace and input features.
arcpy.env.workspace = r"C:\\LBR\\MyData.gdb"
inputFeatures = 'ObesityDiabetes'
# Set the output workspace and output name.
outws = 'C:\\LBR\\outputs.gdb'
outputName = 'LBR_Results'
# Set input features, dependent variable, and explanatory variable.
depVar = 'DiabetesRate'
explVar = 'ObesityRate'
# Set number of neighbors and permutations.
numNeighbors = 50
numPerms = '999'
# Choose to create pop-ups.
popUps = 'CREATE_POPUP'
# Choose confidence level and apply False Discovery Rate correction.
confLevel = '95%'
fdr = 'APPLY_FDR'
# Set the scaling factor.
scaleFactor = 0.5
# Run Local Bivariate Relationships.
arcpy.stats.LocalBivariateRelationships(inputFeatures, depVar, explVar,
os.path.join(outws, outputName),
numNeighbors, numPerms, popUps,
confLevel, fdr, scaleFactor)
except arcpy.ExecuteError:
# If an error occurred when running the tool, print the error message.
print(arcpy.GetMessages())