Skip To Content

結合

結合ツールは、指定したリレーションシップに基づいてデータセットを結合します。 データセットは、一致する属性、空間リレーションシップ、時系列リレーションシップ、またはその 3 つの任意の組み合わせを使用して結合することができます。

結合ツールは、次のようなシナリオで使用できます。

  • 一致する countyID フィールド値に基づいて、郡ポリゴンと郡の国勢調査データを結合します。
  • 時系列リレーションシップと空間リレーションシップの両方を使用して、相対的な時間と場所で発生したレコードを結合します。

パラメーター

次の表に、結合ツールで使用するパラメーターの概要を示します。

パラメーター説明

ターゲット データセット

レコードを結合するデータセット。

結合データセット

ターゲット データセットに結合されるデータセット。

結合方法

一致するすべてのレコードを結合するか (1 対多)、一致するすべてのレコードを集計するか (1 対 1) を指定します。

結合タイプ

一致する結合レコードがないターゲット レコードを出力で返すかどうかを指定します。

サマリー フィールド

統計を計算する結合データセット フィールドを指定します。

一致するフィールドの使用

属性リレーションシップを使用するかどうかを指定します。

ターゲット フィールド

結合データセットのレコードとの照合に使用するターゲット データセットのフィールド。

結合フィールド

ターゲット データセットのレコードとの照合に使用する結合データセットのフィールド。

空間リレーションシップの使用

空間リレーションシップを使用するかどうかを指定します。

空間リレーションシップ

ターゲット データセットと結合データセット間の結合条件の定義に使用する空間リレーションシップ タイプを指定します。

近隣距離

互いに近接する場所の決定に使用する直線距離の閾値。 このパラメーターは、[平面近接] タイプまたは [測地線近接] タイプの空間リレーションシップでのみ使用できます。

近接距離の単位

距離の閾値の単位。 このパラメーターは、[平面近接] タイプまたは [測地線近接] タイプの空間リレーションシップでのみ使用できます。

ターゲット ジオメトリ

結合データセットとの空間リレーションシップの特定に使用するターゲット データセットのジオメトリ フィールド。

結合ジオメトリ

ターゲット データセットとの空間リレーションシップの特定に使用する結合データセットのジオメトリ フィールド。

時系列リレーションシップの使用

時系列リレーションシップを使用するかどうかを指定します。

時系列リレーションシップ

ターゲット データセットと結合データセット間の結合条件の定義に使用する時系列リレーションシップ タイプを指定します。

近隣距離

互いに時間的に近接するレコードの決定に使用する時間距離の閾値。 このパラメーターは、[近接][近接 (前)][近接 (後)] タイプの時系列リレーションシップでのみ使用できます。

近接距離の単位

時間距離の閾値の単位。 このパラメーターは、[近接][近接 (前)][近接 (後)] タイプの時系列リレーションシップでのみ使用できます。

ターゲット開始時間

レコードの開始時間の指定に使用するターゲット データセットの日時フィールド。

ターゲット終了時間

レコードの終了時間の指定に使用するターゲット データセットの日時フィールド。 時間タイプに間隔を使用して結合する場合、このパラメーターは必須です。 詳細については、「Data Pipelines の時系列リレーションシップ」をご参照ください。

結合開始時間

レコードの開始時間の指定に使用する結合データセットの日時フィールド。

結合終了時間

レコードの終了時間の指定に使用する結合データセットの日時フィールド。 時間タイプに間隔を使用して結合する場合、このパラメーターは必須です。 詳細については、「Data Pipelines の時系列リレーションシップ」をご参照ください。

使用上の注意

レコードを結合するデータセットを特定するには、[ターゲット データセット] パラメーターを使用します。 ターゲット レコードに結合するレコードを含むデータセットを特定するには、[結合データセット] パラメーターを使用します。

同じターゲット レコードに複数の結合レコードが一致する場合、すべての一致するレコードを個別に結合するか ([1 対多の結合] オプション)、または一致するすべてのレコードをまとめて結合するか ([1 対 1 の結合] オプション) を指定できます。

  • [1 対多の結合] - 結合データセット内のすべての一致するレコードがターゲット データセットに結合されます。 出力データセットには、ターゲット レコードの複数レコードが含まれます。
  • [1 対 1 の結合] - すべての一致する結合レコードが、ターゲット データセット内の各レコードとまとめて結合されます。 一致するレコードがあるレコードのみが、集約と出力に含まれます。 結合後のレコードの個数が加算されます。 デフォルトでは、出力レコード クラスに、リレーションシップが指定されたターゲット レコードのみが保持されます ([内部結合])。 [左結合] が指定されている場合、すべての入力ターゲット レコードが出力レコード クラスに書き込まれます (これを左外部結合と呼びます)。
1 対多の結合と 1 対 1 の結合の例
この例では、1 対 1 の結合に個数だけが含まれています。

[サマリー フィールド] パラメーターでは、結合データセット内のフィールドを集計するかを決定します。 [サマリー フィールド] パラメーターは、結合方法が [1 対多の結合] の場合に使用できます。 次の統計サマリーが利用可能です。

  • [合計] - フィールド内の数値の合計。 [null, 1, 3] の合計は 4 です。
  • [最小] - 数値または日付フィールドの最小値。 [0, 2, null] の最小値は 0 です。
  • [最大] - 数値または日付フィールドの最大値。 [0, 2, null] の最大値は 2 です。
  • [平均] - 数値の平均。 [0, 2, null] の平均は 1 です。
  • [標準偏差] - 数値フィールドの標準偏差。 [null, 1, 1, 1] の標準偏差は 0 です。
  • [個数] - 非 NULL 値の数。 任意のタイプのフィールドで使用できます。 [null, "hello", "world"] の数は 2 です。
  • [すべて] - 任意のタイプのフィールドのサンプル値。

空間リレーションシップ、時系列リレーションシップ、属性リレーションシップ、またはこれら 3 つの組み合わせに基づいてレコードを結合できます。 空間結合では、空間位置に基づいて、入力レコード ([ターゲット データセット] パラメーター値と [結合データセット] パラメーター値) からのレコード (行) を照合します。 時間結合では、時系列リレーションシップに基づいて、入力レコードからのレコードを照合します。 属性結合では、フィールド値に基づいてレコードを照合します。 次の表では、各結合リレーションシップ タイプについて説明します。

リレーションシップ説明

属性

レコードが互いに結合しているかどうかを判断する属性リレーションシップ。 レコードは、結合データセットのフィールド値がターゲット データセットのフィールド値に等しい場合に一致します。 同じタイプのフィールドを使用することをお勧めします。

空間

レコードが互いに結合しているかどうかを判断する空間リレーションシップ。 使用可能なリレーションシップは、結合されるデータセットのジオメトリのタイプ (ポイント、ライン、エリア) によって決まります。 使用可能な空間リレーションシップを次に示します。

  • 交差する
  • 等しい
  • [平面近接] - 平面距離を使用します。
  • [測地線近接] - 測地距離を使用します。
  • 含む
  • 含まれる
  • 接する
  • 横切る
  • 重複する

時間

レコードが互いに結合しているかどうかを判断する時系列リレーションシップ。 使用可能なリレーションシップは、結合されるデータセットの時系列のタイプ (インスタントまたは間隔) によって決まります。 使用可能な時系列リレーションシップを次に示します。

  • 接続する
  • 接続される
  • 重複する
  • 重複される
  • 期間内にある
  • 含む
  • 等しい
  • 終了する
  • 終了される
  • 開始する
  • 開始される
  • 交差する
  • 最近接
  • 近接 (前)
  • 近接 (後)

ターゲット ジオメトリと結合ジオメトリの座標系が異なる場合、空間リレーションシップの解析にはターゲット データセットの座標系が使用されます。

[空間リレーションシップ] パラメーター値が [平面近接] の場合、[ターゲット ジオメトリ] パラメーター値は投影座標系である必要があります。

出力

1 対多の結合を実行すると、ターゲット データセットと結合データセットのすべてのフィールドが出力に含まれます。 同じフィールド名が両方のデータセットに存在する場合、結合フィールドの先頭に join が付加されます (例: join_fieldname)。

1 対 1 の結合を実行すると、ターゲット データセットのすべてのフィールド (ジオメトリを含む) に加えて、次のフィールドが出力に含まれます。

フィールド名説明

COUNT

結合されたレコードの個数。 これは常に出力に含まれます。

STATISTIC_fieldname

指定された統計がそれぞれ属性フィールドを作成し、「STATISTIC_fieldname」という形式の名前が付けられます。 たとえば、id フィールドの最大値は MAX_id です。

START_DATETIME

このフィールドは開始時間を表し、時系列的結合を使用する場合にのみ含まれます。

END_DATETIME

このフィールドは終了時間を表し、間隔時間値を含む時系列的結合を使用する場合にのみ含まれます。

ライセンス要件

次のライセンスと構成が必要です。

  • Creator または Professional ユーザー タイプ
  • 公開者、ファシリテーター、管理者ロール、またはそれと同等のカスタム ロール

Data Pipelines の要件の詳細については、要件をご参照ください。

関連トピック

詳細については、以下のトピックをご参照ください。