クリギング (Kriging) の仕組み

Spatial Analyst のライセンスで利用可能。

3D Analyst のライセンスで利用可能。

クリギングは、Z 値を持つ散在ポイント セットから推定サーフェスを生成する高度な地球統計学的手法です。内挿ツールセットの他の内挿法と異なり、 ツールでは、Z 値によって表される現象の空間的振舞いを対話的に検証してから、出力サーフェスを生成するための最適な推定方法を選択する必要があります。

クリギングとは

(逆距離加重) 内挿ツールおよび 内挿ツールは、周囲の計測値または指定した数学式が出力サーフェスの滑らかさを決定し、結果に直接影響することから、決定論的内挿法と呼ばれます。一方、2 つめの内挿法のファミリーは、クリギングのような自己相関を含む、つまり相互に統計的な関係を持つ計測値を持つ統計モデルに基づく、地球統計学的な方法で構成されます。このため、地球統計学的手法は、予測サーフェスを作成できるだけでなく、予測の確実性または精度の尺度も提供します。

クリギングでは、複数のサンプル ポイント間の距離または方向が、サーフェス上の変動の説明に使用できる空間的相関を反映していると仮定しています。 ツールは、指定数のポイント、または指定半径内のすべてのポイントに数学関数を当てはめ、各位置の出力値を決定します。クリギングは複数ステップのプロセスです。データの予備的統計解析、バリオグラムのモデル化、サーフェスの作成、およびオプションとして分散サーフェスの調査を含みます。データ内に空間的な相関を持つ距離または方向のバイアスがある場合、クリギングが最適です。多くの場合、土壌学や地質学で使用されます。

クリギングの式

クリギングは、周囲の計測値を加重して未計測の位置を予測する点で、IDW に似ています。両方の内挿法の一般的な式は、データの加重合計として構成されます。

加重合計式

  • ここで、

    Z(si) = i 番めの位置における計測値

    λi = i 番めの位置における計測値の不明な加重

    s0 = 予測位置

    N = 計測値の数

IDW では、加重 λiは予測位置までの距離のみで決まります。ただし、クリギングの手法では、加重は計測ポイントと予測位置との距離だけでなく、計測ポイントの全体的な空間的配置によっても決まります。加重の空間的配置を使用するには、空間的自己相関を定量化する必要があります。したがって、通常クリギングでは、加重 λi は計測ポイントの近似モデル、予測位置までの距離、および予測位置周囲の計測値間の空間的関係によって決まります。次のセクションでは、一般的なクリギングの式を使用して、予測サーフェスを持つマップ、および予測の精度を持つマップを作成する方法について説明します。

クリギングによる予測サーフェス マップの作成

クリギング内挿法で予測を行うには、次の 2 つのタスクが必要です。

  • 従属性のルールを発見する。
  • 予測を行う。

これらの 2 つのタスクを実現するために、クリギングは次の 2 つのステップを持つプロセスを実行します。

  1. 自己相関モデル (近似モデル) に依存する統計的従属性 (空間的自己相関と呼ばれる) の値を推定するための、バリオグラムと共分散関数を作成する。
  2. 未知の値を予測する (予測を行う)。

このように個別タスクが 2 つあるため、クリギングはデータを 2 回使用すると言われています。1 回めはデータの空間的自己相関を推定するため、2 回めは予測を行うためです。

Variography

モデル近似、または空間的モデル化は、構造解析やバリオグラフィとも呼ばれます。計測ポイントの構造の空間モデリングでは、経験的セミバリオグラムのグラフを使用します。距離 h 間隔で配置されたすべての位置ペアについて、次の数式を用いて計算します。

Semivariogram(distanceh) = 0.5 * average((valuei – valuej)2)

式では、位置のペアの値の差の二乗が計算されます。

以下の図に、あるポイント (赤のポイント) とその他すべての計測位置とのペアを示します。各計測ポイントについて、このプロセスが継続されます。

ペアになっている位置間の差の二乗を計算
ペアになっている位置間の差の二乗を計算

多くの場合、位置の各ペアの距離は一意で、多数のポイントのペアがあります。すべてのペアを即座にプロットすると、管理が困難になります。各ペアをプロットする代わりに、ペアがラグ ビンにグループ化されます。たとえば、ポイント間の距離が 40 m より大きく 50 m 未満のポイント ペアのすべてについて、平均セミバリアンスを計算します。経験的セミバリオグラムは、Y 軸に平均セミバリオグラムの値、X 軸に距離 (またはラグ) を持つグラフです (下図参照)。

経験的セミバリオグラム グラフの例
経験的セミバリオグラム グラフの例

空間的自己相関は、近くにあるものは遠くにあるものよりも似ているという地理の原則を定量化します。したがって、位置のペアの距離が小さい (セミバリオグラムの分布の X 軸の左端) ほど、似た値をとります (セミバリオグラムの分布の Y 軸の下方)。位置のペアの距離が大きい (セミバリオグラムの分布の X 軸の右方に移動) ほど、ペアの類似性は小さくなり、差の二乗の値が大きくなります (セミバリオグラムの分布の Y 軸の上方に移動)。

経験的セミバリオグラムのモデル近似

次のステップは、経験的セミバリオグラムを構成するポイントをモデルで近似することです。セミバリオグラムのモデル化は、空間の記述と空間的予測の間にある重要なステップです。クリギングの主なアプリケーションは、サンプリングしていない位置の属性の予測です。経験的セミバリオグラムは、データセットの空間的自己相関に関する情報を示します。ただし、すべての方向と距離の情報を示すわけではありません。このため、さらにクリギングの予測が正のクリギング分散を確実に取るように、モデル近似する必要があります。つまり連続的な関数または曲線で経験的セミバリオグラムを近似する必要があります。抽象的には、これは、データ ポイントを連続する直線または曲線で近似する回帰分析に似ています。

経験的セミバリオグラムをモデルで近似するには、モデルとなる関数を選択します。たとえば、増加して、その後特定の範囲を超えた大きい距離で一定になる球のタイプの関数を選択します (後述の球モデル例を参照)。経験的セミバリオグラムのポイントと、モデルには差があります。モデルの曲線の上にあるポイントも、下にあるポイントもあります。ただし、曲線の上にある各ポイントの距離の合計と、下にある各ポイントの合計の 2 つの値は似たような値になります。選択できるセミバリオグラムのモデルは多数あります。

セミバリオグラムのモデル

ツールには、経験的セミバリオグラムのモデル化に選択できる次の関数が用意されています。

  • 円形
  • Spherical
  • 指数関数
  • Gaussian
  • 直線

選択したモデルは未知の値の予測に影響し、原点近くの曲線形状が大きく異なる場合に特に当てはまります。原点近くで曲線の勾配が大きくなるほど、予測に対する最近傍の影響が大きくなります。その結果、出力サーフェスが粗くなります。各モデルは、さまざまな種類の現象をより正確になぞるように設計されています。

以下の図に、2 つの一般的なモデルと関数の違いを示します。

球モデルの例

このモデルでは、ある距離まで空間的自己相関が徐々に減少 (セミバリアンスが増加) し、その距離を超えると自己相関が 0 になります。球モデルは、最も一般的に使用されるモデルの 1 つです。

球モデルの例
球モデルの例

指数モデルの例

このモデルは、距離の増加と共に空間的自己相関が指数的に減少する場合に適用します。自己相関がまったくなくなるのは、無限大の距離のみです。指数モデルも、一般的に使用されるモデルです。使用するモデルの選択は、データの空間的自己相関、および現象に対する事前知識に基づきます。

指数モデルの例
指数モデルの例

これらの数学モデルについて詳しくは、この後の説明をご参照ください。

セミバリオグラム - レンジ、シル、およびナゲット

前述したように、セミバリオグラムは計測したサンプル ポイントの空間的自己相関を表します。地理の原則 (近いものほど似る) により、近くにある計測ポイントは通常、遠くにある計測ポイントよりも差の二乗の値が小さくなります。グループ化後に位置の各ペアをプロットすると、モデルで近似されます。これらのモデルを説明するために、レンジ、シル、ナゲットが一般的に使用されます。

レンジとシル

セミバリオグラムのモデルを見ると、ある距離でモデルが一定になることが分かります。モデルがはじめに平坦になる距離が、レンジと呼ばれます。レンジよりも近い距離にあるサンプル位置は、空間的自己相関があります。一方、レンジよりも遠い距離には空間的自己相関はありません。

レンジ、シル、ナゲットを示す図
レンジ、シル、ナゲットを示す図

セミバリオグラムがレンジに達する値 (Y 軸の値) をシルと呼びます。部分シルは、シルからナゲットを差し引いた部分です。ナゲットについては次のセクションで説明します。

Nugget

理論的に、分離距離 0 (ラグが 0 など) では、セミバリオグラム値は 0 です。ただし、無限に小さい分離距離では、セミバリオグラムはしばしばナゲット効果 (0 より大きい値) を示します。セミバリオグラム モデルの Y 切片が 2 の場合、ナゲットは 2 です。

ナゲット効果の原因は、計測エラー、またはサンプリング間隔よりも小さい距離にある変動の空間的ソース (または両方) である可能性があります。計測エラーは、計測デバイスに特有のエラーにより発生します。自然現象は、スケールの範囲にわたって空間的に異なる場合があります。サンプリング距離よりも小さい微小スケールでの変動は、ナゲット効果の一部として現れます。データを収集する前に、着目する空間的変動のスケールを理解することが重要です。

予測の実行

データの従属性または自己相関を発見し (「バリオグラフィ」を参照)、データの空間情報を使用して距離を計算し、空間的自己相関をモデル化したら (データの 1 回めの使用)、近似モデルを使用して予測ができます。その後、経験的セミバリオグラムは使用しません。

これで、データを使用して予測ができます。IDW 内挿法と同様に、クリギングは未計測位置を予測するために、周囲の計測値から加重を作成します。IDW 内挿法と同様に、未計測の位置に最も近い計測値が最大の影響をおよぼします。ただし、クリギングでは、周囲の計測ポイントの加重は、IDW の加重よりも洗練されています。IDW では距離に基づく単純なアルゴリズムを使用しますが、クリギングの加重は、データの空間的性質に着目して作成されたセミバリオグラムから得られます。現象の連続サーフェスを作成するために、セミバリオグラム、および近傍の計測値の空間的配置に基づいて解析エリアの各位置、またはセル中心について予測が行われます。

クリギング手法

クリギング手法には、通常型と普遍型の 2 種類があります。

通常型クリギングは、最も一般的に幅広く使用されているクリギング手法で、デフォルトです。通常型クリギングでは、定数の平均値が不明だと仮定します。これを却下する科学的な根拠がない限り、これは妥当な前提です。

普遍型クリギングでは、データに優勢な傾向 (卓越風など) があり、かつこれを決定論的関数の多項式でモデル化できると仮定します。この多項式が元の計測ポイントから減算され、ランダムな誤差から自己相関がモデル化されます。ランダムなエラーをモデルで近似すると、予測を行う前に多項式が加算され、意味のある結果が得られます。普遍型クリギングは、データに傾向があることが分かっていて、かつ表す式に科学的な根拠がある場合にのみ使用します。

セミバリオグラム グラフ

クリギングは、このトピックで説明する以上の空間的統計知識を必要とする複雑な手順です。クリギングを使用する前に、その原理を十分に理解し、入手したデータがこの手法でのモデリングに適しているかどうかを評価する必要があります。クリギング手法をよく理解していない場合は、このトピックの最後に記載されている文献を参照することをお勧めします。

クリギングは、「Z 値で表される現象の空間的変動がサーフェス全体で統計的に均一である」ことを前提とする地域化変数理論に基づいています (たとえば、サーフェスのすべての場所で同じ変動パターンが認められる場合など)。この「空間的均一性」の前提が地域化変数理論の基本となります。

数学モデル

以下は、セミバリアンスの説明で使用される数学モデルの一般的な形状と数式です。

球セミバリアンス モデルの図
球セミバリアンス モデルの図
円セミバリアンス モデルの図
円セミバリアンス モデルの図
指数セミバリアンス モデルの図
指数セミバリアンス モデルの図
ガウス セミバリアンス モデルの図
ガウス セミバリアンス モデルの図
線形セミバリアンス モデルの図
線形セミバリアンス モデルの図

参照

Burrough, P. A. Principles of Geographical Information Systems for Land Resources Assessment. New York: Oxford University Press. 1986.

Heine, G. W. "A Controlled Study of Some Two-Dimensional Interpolation Methods." COGS Computer Contributions 3 (no. 2): 60–72. 1986.

McBratney, A. B., and R. Webster. "Choosing Functions for Semi-variograms of Soil Properties and Fitting Them to Sampling Estimates." Journal of Soil Science 37: 617–639. 1986.

Oliver, M. A. "Kriging: A Method of Interpolation for Geographical Information Systems." International Journal of Geographic Information Systems 4: 313-332. 1990.

Press, W. H., S. A. Teukolsky, W. T. Vetterling, and B. P. Flannery. Numerical Recipes in C: The Art of Scientific Computing. New York: Cambridge University Press. 1988.

Royle, A. G., F. L. Clausen, and P. Frederiksen. "Practical Universal Kriging and Automatic Contouring." Geoprocessing 1: 377–394. 1981.

関連トピック