結合ツールは、指定したリレーションシップに基づいてデータセットを結合します。 データセットは、一致する属性、空間リレーションシップ、時系列リレーションシップ、またはその 3 つの任意の組み合わせを使用して結合することができます。
例
結合ツールは、次のようなシナリオで使用できます。
- 一致する countyID フィールド値に基づいて、郡ポリゴンと郡の国勢調査データを結合します。
- 時系列リレーションシップと空間リレーションシップの両方を使用して、相対的な時間と場所で発生したレコードを結合します。
パラメーター
次の表に、結合ツールで使用するパラメーターの概要を示します。
パラメーター | 説明 |
---|---|
ターゲット データセット | レコードを結合するデータセット。 |
結合データセット | ターゲット データセットに結合されるデータセット。 |
結合方法 | 一致するすべてのレコードを結合するか (1 対多)、一致するすべてのレコードを集計するか (1 対 1) を指定します。 |
結合タイプ | 一致する結合レコードがないターゲット レコードを出力で返すかどうかを指定します。 |
サマリー フィールド | 統計を計算する結合データセット フィールドを指定します。 |
一致するフィールドの使用 | 属性リレーションシップを使用するかどうかを指定します。 |
ターゲット フィールド | 結合データセットのレコードとの照合に使用するターゲット データセットのフィールド。 |
結合フィールド | ターゲット データセットのレコードとの照合に使用する結合データセットのフィールド。 |
空間リレーションシップの使用 | 空間リレーションシップを使用するかどうかを指定します。 |
空間リレーションシップ | ターゲット データセットと結合データセット間の結合条件の定義に使用する空間リレーションシップ タイプを指定します。 |
近隣距離 | 互いに近接する場所の決定に使用する直線距離の閾値。 このパラメーターは、[平面近接] タイプまたは [測地線近接] タイプの空間リレーションシップでのみ使用できます。 |
近接距離の単位 | 距離の閾値の単位。 このパラメーターは、[平面近接] タイプまたは [測地線近接] タイプの空間リレーションシップでのみ使用できます。 |
ターゲット ジオメトリ | 結合データセットとの空間リレーションシップの特定に使用するターゲット データセットのジオメトリ フィールド。 |
結合ジオメトリ | ターゲット データセットとの空間リレーションシップの特定に使用する結合データセットのジオメトリ フィールド。 |
時系列リレーションシップの使用 | 時系列リレーションシップを使用するかどうかを指定します。 |
時系列リレーションシップ | ターゲット データセットと結合データセット間の結合条件の定義に使用する時系列リレーションシップ タイプを指定します。 |
近隣距離 | 互いに時間的に近接するレコードの決定に使用する時間距離の閾値。 このパラメーターは、[近接]、[近接 (前)]、[近接 (後)] タイプの時系列リレーションシップでのみ使用できます。 |
近接距離の単位 | 時間距離の閾値の単位。 このパラメーターは、[近接]、[近接 (前)]、[近接 (後)] タイプの時系列リレーションシップでのみ使用できます。 |
ターゲット開始時間 | レコードの開始時間の指定に使用するターゲット データセットの日時フィールド。 |
ターゲット終了時間 | レコードの終了時間の指定に使用するターゲット データセットの日時フィールド。 時間タイプに間隔を使用して結合する場合、このパラメーターは必須です。 詳細については、「Data Pipelines の時系列リレーションシップ」をご参照ください。 |
結合開始時間 | レコードの開始時間の指定に使用する結合データセットの日時フィールド。 |
結合終了時間 | レコードの終了時間の指定に使用する結合データセットの日時フィールド。 時間タイプに間隔を使用して結合する場合、このパラメーターは必須です。 詳細については、「Data Pipelines の時系列リレーションシップ」をご参照ください。 |
使用上の注意
レコードを結合するデータセットを特定するには、[ターゲット データセット] パラメーターを使用します。 ターゲット レコードに結合するレコードを含むデータセットを特定するには、[結合データセット] パラメーターを使用します。
同じターゲット レコードに複数の結合レコードが一致する場合、すべての一致するレコードを個別に結合するか ([1 対多の結合] オプション)、または一致するすべてのレコードをまとめて結合するか ([1 対 1 の結合] オプション) を指定できます。
- [1 対多の結合] - 結合データセット内のすべての一致するレコードがターゲット データセットに結合されます。 出力データセットには、ターゲット レコードの複数レコードが含まれます。
- [1 対 1 の結合] - すべての一致する結合レコードが、ターゲット データセット内の各レコードとまとめて結合されます。 一致するレコードがあるレコードのみが、集約と出力に含まれます。 結合後のレコードの個数が加算されます。 デフォルトでは、出力レコード クラスに、リレーションシップが指定されたターゲット レコードのみが保持されます ([内部結合])。 [左結合] が指定されている場合、すべての入力ターゲット レコードが出力レコード クラスに書き込まれます (これを左外部結合と呼びます)。
[サマリー フィールド] パラメーターでは、結合データセット内のフィールドを集計するかを決定します。 [サマリー フィールド] パラメーターは、結合方法が [1 対多の結合] の場合に使用できます。 次の統計サマリーが利用可能です。
- [合計] - フィールド内の数値の合計。 [null, 1, 3] の合計は 4 です。
- [最小] - 数値または日付フィールドの最小値。 [0, 2, null] の最小値は 0 です。
- [最大] - 数値または日付フィールドの最大値。 [0, 2, null] の最大値は 2 です。
- [平均] - 数値の平均。 [0, 2, null] の平均は 1 です。
- [標準偏差] - 数値フィールドの標準偏差。 [null, 1, 1, 1] の標準偏差は 0 です。
- [個数] - 非 NULL 値の数。 任意のタイプのフィールドで使用できます。 [null, "hello", "world"] の数は 2 です。
- [すべて] - 任意のタイプのフィールドのサンプル値。
空間リレーションシップ、時系列リレーションシップ、属性リレーションシップ、またはこれら 3 つの組み合わせに基づいてレコードを結合できます。 空間結合では、空間位置に基づいて、入力レコード ([ターゲット データセット] パラメーター値と [結合データセット] パラメーター値) からのレコード (行) を照合します。 時間結合では、時系列リレーションシップに基づいて、入力レコードからのレコードを照合します。 属性結合では、フィールド値に基づいてレコードを照合します。 次の表では、各結合リレーションシップ タイプについて説明します。
リレーションシップ | 説明 |
---|---|
属性 | レコードが互いに結合しているかどうかを判断する属性リレーションシップ。 レコードは、結合データセットのフィールド値がターゲット データセットのフィールド値に等しい場合に一致します。 同じタイプのフィールドを使用することをお勧めします。 |
空間 | レコードが互いに結合しているかどうかを判断する空間リレーションシップ。 使用可能なリレーションシップは、結合されるデータセットのジオメトリのタイプ (ポイント、ライン、エリア) によって決まります。 使用可能な空間リレーションシップを次に示します。
|
時間 | レコードが互いに結合しているかどうかを判断する時系列リレーションシップ。 使用可能なリレーションシップは、結合されるデータセットの時系列のタイプ (インスタントまたは間隔) によって決まります。 使用可能な時系列リレーションシップを次に示します。
|
ターゲット ジオメトリと結合ジオメトリの座標系が異なる場合、空間リレーションシップの解析にはターゲット データセットの座標系が使用されます。
[空間リレーションシップ] パラメーター値が [平面近接] の場合、[ターゲット ジオメトリ] パラメーター値は投影座標系である必要があります。
出力
1 対多の結合を実行すると、ターゲット データセットと結合データセットのすべてのフィールドが出力に含まれます。 同じフィールド名が両方のデータセットに存在する場合、結合フィールドの先頭に join が付加されます (例: join_fieldname)。
1 対 1 の結合を実行すると、ターゲット データセットのすべてのフィールド (ジオメトリを含む) に加えて、次のフィールドが出力に含まれます。
フィールド名 | 説明 |
---|---|
COUNT | 結合されたレコードの個数。 これは常に出力に含まれます。 |
STATISTIC_fieldname | 指定された統計がそれぞれ属性フィールドを作成し、「STATISTIC_fieldname」という形式の名前が付けられます。 たとえば、id フィールドの最大値は MAX_id です。 |
START_DATETIME | このフィールドは開始時間を表し、時系列的結合を使用する場合にのみ含まれます。 |
END_DATETIME | このフィールドは終了時間を表し、間隔時間値を含む時系列的結合を使用する場合にのみ含まれます。 |
ライセンス要件
次のライセンスと構成が必要です。
- Creator または Professional ユーザー タイプ
- 公開者、ファシリテーター、管理者ロール、またはそれと同等のカスタム ロール
Data Pipelines の要件の詳細については、要件をご参照ください。
関連トピック
詳細については、以下のトピックをご参照ください。