ポイントの集約

ツール アイコン ビッグ データ解析で使用できます。

[ポイントの集約] ツール は、エリア フィーチャ内のポイント フィーチャを収集および集計します。 エリア フィーチャの境界線を使用して、各エリア内のポイントを収集した後、それらを使用して統計情報を計算します。 生成されるレイヤーには、各エリア内のポイント数およびサマリー計算が含まれます。

ワークフロー図

エリア フィーチャ内でグループ別に集約されたポイント

ツールの使用例を次に示します:

トルネードは、米国で発生する激しい嵐です。 あなたは、各州や郡で発生する死亡者やけが人の数、物的損害、経済的損失などの竜巻による影響について知りたいと考えています。 トルネードの位置にアクセスできますが、特定のエリア内のデータを視覚化するために、さらに良い方法が必要です。 竜巻のデータを州や郡の境界線内に集約し、人口別のデータを正規化して、竜巻が最も大きな影響を与えたエリアを探すことができます。

使用上の注意

ツールを操作する際には、以下の点に注意してください:

  • 出力レイヤーは、常にポリゴン レイヤーです。 ポイントが発生しているポリゴン ビンまたはフィーチャのみが返されます。
  • 解析のためにエリア レイヤーを提供するか、指定したサイズおよび形状 (六角形または四角形) のビンを生成してポイント フィーチャを集約できます。 ビンのサイズは、ビンの大きさを指定します。 六角形に集約している場合、サイズは各六角形の高さになり、生成される六角形の幅は、高さの 2 倍を 3 の平方根で除算した値になります。 四角形に集約している場合は、ビンのサイズは四角形の高さ (幅と同じ) になります。

    ポイントの集約のビンの高さの計算 (六角形と四角形のビンの場合)

  • ターゲット データで時間が有効になっている場合は、時間ステップを解析に適用できます。
  • 最も基本的な集約では、各エリア内のポイント数を計算します。 個数、合計、最小、最大、範囲、平均、標準偏差などの統計情報は数値フィールドで計算でき、個数やすべてなどの統計情報は文字列フィールドで計算することができます。 これらの統計情報は、エリアごとに個別に計算されます。

    戻り値の例を次に示します。

    • フィールドに [個数] が適用されると、フィールドの非 NULL 値のカウントが返されます。
    • 文字列フィールドに [すべて] が適用されると、フィールドの 1 つの文字列が返されます。
  • [ポイントの集約] ツールでは、時間ステップを使用して解析することができます。 各時間ステップは、時間ステップ外のフィーチャとは切り離して解析されます。 時間ステップを使用するには、ターゲット データが時間対応であり、任意の時点を表している必要があります。 時間ステップが使用されると、出力フィーチャは StartTime および EndTime フィールドで表される時間間隔になります。
  • 時間ステップの [間隔][反復]、または [調整] オプションを指定し、データで時間が有効になっていない場合は、ツールの実行時にエラーが発生します。
  • 時間ステップ オプションには、日時の値または日付のみの値を指定できますが、時間のみの値は指定できません。
  • [ポイントの集約] ツールでは、ターゲット データが投影されているか、ターゲット データが投影座標系に設定されている必要があります。 ターゲット データが投影座標系の範囲内になく、投影座標系を設定していない場合、ツールは自動的に正積円筒図法投影座標系を解析中のデータに適用します。

パラメーター

ツールには、次のパラメーターがあります:

パラメーター説明データ タイプ

ターゲット データ

ビンまたはポリゴンに集約されるポイント フィーチャ。

フィーチャ

結合データ

(オプション)

ターゲット データの集約に使用されるポリゴン フィーチャ。 データをポリゴンに集約するには、結合データ ソースが必要です。

フィーチャ

ポイントの集約先

ターゲット データの集約方法を指定します。 次のオプションがあります。

  • [ビン] - ターゲット データは四角形または六角形のビンに集約されます。 このオプションには [ターゲット データ] パラメーターが必要です。
  • [ポリゴン] - ターゲット データは結合データのポリゴンに集約されます。 このオプションには [結合データ] パラメーターが必要です。

String

ビン タイプ

(オプション)

ビンを作成するために使用されるビンの形状。 オプションは、[四角形] (デフォルト) と [六角形] です。

ソースが結合ポートに接続されいてる場合、このパラメーターは使用できません。

注意:

このパラメーターは、ポイントの集約 (ポリゴンまたはビン)] パラメーターが [ビン] に設定されている場合のみ使用できます。

String

ビン サイズ

(オプション)

ターゲット データの集約先となるビン サイズを表す距離間隔。 四角形のビンの場合、ビン サイズはその四角形の高さを表します。 六角形のビンの場合、ビン サイズは、2 つの並行辺間の高さを表します。

ソースが結合ポートに接続されいてる場合、このパラメーターは使用できません。

注意:

このパラメーターは、ポイントの集約 (ポリゴンまたはビン)] パラメーターが [ビン] に設定されている場合のみ使用できます。

String

間隔 (オプション)

時間ステップの期間。

このオプションは、ターゲット データが時間対応であり、任意の時点を表している場合のみ使用します。

時間ステップの仕組みの詳細

String

繰り返し (オプション)

時間ステップの間隔が発生する頻度を指定します。

このオプションは、ターゲット データが時間対応であり、任意の時点を表している場合のみ使用します。

String

配置

(オプション)

時間ステップの調整に使用する基準時間。 デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターのチェックボックスをオンにして、日時の範囲を選択します。

このオプションは、ターゲット データが時間対応であり、任意の時点を表している場合のみ使用します。

Int64

集計フィールド (オプション)

指定したフィールドに関して計算される統計情報。 指定したフィールドが文字列フィールド、数値フィールド、または日付フィールドのいずれであるかに応じて、異なる統計情報を使用できます。

  • [すべて] - 文字列データ タイプのフィールドからサンプル文字列を計算します。
  • [個数] - NULL 値でない値の数を計算します。 数値フィールドまたは文字列に使用できます。 [null, 0, 2] のデータの個数は 2 です。
  • [重複を除いたカウント] - 重複を除いた NULL 値でない値の数を計算します。 数値フィールドまたは文字列に使用できます。 [null, 4, 3, 4] の結果の重複を除いた個数は 2 です。
  • [合計] - フィールド内の数値の合計を計算します。 [null, 1, 3] の合計は 4 です。
  • [平方和] - 各観測データと全体平均の二乗差の合計を計算します。 [null, 2.2, 3.1, 4.7] の平方和は 3.206 です。
  • [最小] - 数値フィールドの最小値を計算します。 [0, 2, null] の最小値は 0 です。
  • [最大] - 数値フィールドの最大値を計算します。 [0, 2, null] の最大値は 2 です。
  • [平均] - 数値フィールドの平均値を計算します。 [0,2, null] の平均値は 1 です。
  • [範囲] - 最大値から最小値を引くことで数値フィールドの範囲を計算します。 [0, null, 1] の範囲は 1 です。 [null, 4] の範囲は 0 です。
  • [分散] - トラッキング内の数値フィールドの分散を計算します。 [1] の分散は NULL です。 [null, 1,1,1] の分散は 1 です。
  • [標準偏差] - 数値フィールドの標準偏差を計算します。 [1] の標準偏差は NULL です。 [null, 1,1,1] の標準偏差は 1 です。

String

出力レイヤー

出力レイヤーには、エリア フィーチャからのすべての元のフィールドおよび COUNT フィールドが含まれます。 COUNT フィールドは、このポリゴン フィーチャに集約されたターゲット データのポイント フィーチャの数を表します。 COUNT フィールドのデータ タイプは Float64 です。 集計フィールドを構成する場合、それらのフィールドも出力レイヤーで計算されます。

検討事項と制限事項

ラインおよびポリゴンは、[ポイントの集約] ツールを使用して、境界内に集約できません。