ArcGIS Data Pipelines の使用—ArcGIS Data Pipelines

ArcGIS Data Pipelines アプリで作成したデータパイプラインは、コンテンツ内のアイテムとして格納されます。 Data Pipelines エディターを使用して、データパイプラインを作成および編集します。以下の各セクションでは、データパイプラインエディターの概要と、エディターでのデータパイプラインの作成および実行方法について説明します。

データパイプラインエレメント

データパイプラインには、次のエレメントがあります。

入力
- 入力は、データをデータパイプラインに読み込んで下流方向の処理を行うために使用されます。多くの入力ソースタイプを利用できます。ソースおよびソースタイプの詳細については、「データセットの構成」をご参照ください。
- 1 つのデータパイプラインに複数のデータソースを含めることもできます。データパイプラインワークフローには、少なくとも 1 つのデータソースが必要です。
ツール
- ツールは、入力データセットから読み込まれたデータを処理します。
- 1 つのデータパイプラインに複数のツールを含めることもできます。
- ツールを互いに接続することができ、その場合、1 つのツールの出力が次のツールの入力を表します。
- 利用可能なツールとその使用方法の詳細については、「データの処理」をご参照ください。
出力
- 出力は、データパイプラインの結果で何が実行されるべきかを定義します。
- データパイプラインの結果を新しいフィーチャレイヤーに出力したり、既存のフィーチャレイヤーのデータを置き換えたり、フィーチャレイヤーの既存のデータに追加および更新したりすることができます。
- 1 つのデータパイプラインに複数の出力を含めることもできます。
- 1 つのツールの結果または入力データセットに対して、複数の出力を構成できます。データパイプラインを実行するには、少なくとも 1 つの出力が必要です。
- 結果の書き込みに関する詳細については、「フィーチャレイヤー」をご参照ください。

データパイプラインワークフロー

上で説明したとおり、データパイプラインワークフローは、既存のデータへの接続、データエンジニアリングの実行、新たに用意されたデータの書き出しのエレメントで構成されています。データパイプラインが実行されると、1 つ以上の出力が生成されます。すべての出力結果は、コンテンツで利用できます。

データへの接続

データパイプラインを作成する最初のステップは、データへの接続です。エディターツールバーの [入力] で、接続するソースタイプを選択します。たとえば、[フィーチャレイヤー] を選択してレイヤーを参照したり、[Amazon S3] を選択してデータセットが含まれるバケットとフォルダーを表すデータストアアイテムを参照したりすることができます。データへの接続と読み取りのパフォーマンスを最適化する方法の詳細については、「データセットの構成」をご参照ください。

データ処理の実行

2 つ目のステップは、入力データの処理です。エディターツールバーの [ツール] で、データセットに対して実行する処理を選択します。たとえば、CSV データの位置を計算し、特定の対象地域に対して位置をフィルターするには、[ジオメトリの作成] ツールと [範囲によるフィルター] ツールを使用します。

ツールの入力として使用するデータセットを指定するには、次のいずれかを実行します。

ラインを描画するには、1 つのエレメントのコネクタから他のコネクタにポインターをドラッグします。
入力データセットパラメーターを使用して、入力データセットを特定します。

データの処理はオプションです。データセットに接続した後、処理を行うことなくフィーチャレイヤーとして書き出すことができます。

データパイプライン処理のパフォーマンスを向上させるには、次のツールのいずれかを使用するか、ツールを組み合わせて使用して、操作するデータ量を制限します。

フィールドの選択 - 対象フィールドのみを維持します。たとえば、2000 年と 2010 年のフィールドを含む国勢調査データセットがあり、2010 年のみを対象にするとします。 2010 年の値を表すフィールドのみを選択します。
属性によるフィルター - 特定の属性値を含むレコードのサブセットを維持します。たとえば、地震データセットでマグニチュードが 5.5 より大きい地震をフィルターします。
範囲によるフィルター - 特定の空間範囲内のレコードのサブセットを維持します。たとえば、米国の洪水危険地帯のデータセットを、州の境界を表す別のデータセットの範囲に合わせてフィルターします。

データパイプラインエレメントのプレビュー

ワークフローの任意のステップで、プレビューを使用してデータを調査できます。プレビューには、データを調査するために次の方法が含まれています。

[テーブルのプレビュー] - データを表形式で表示します。
[マップのプレビュー] - データセットの位置をマップ上に表示します。マップのプレビューでは、画面移動、拡大表示、属性の調査を行うことができます。
[スキーマ] - データセットのスキーマを表示します。
[メッセージ] - プレビュー操作により出力されたメッセージを確認します。

プレビューには、最大 8,000 件のデータレコードが表示されます。

日付/時間フィールドをプレビューすると、値はお使いのブラウザーのタイムゾーンで表示されます。値をフィーチャレイヤーに書き込むと、UTC で保存されます。

複雑なジオメトリが含まれているデータセットをプレビューすると、大量のメモリが消費されることがあります。メモリ閾値を超えている場合は、マップのプレビューがレンダリングされなかったり、復元時にステータスが再接続中に変わったりすることがあります。プレビューのパフォーマンスを改善するには、次の操作が可能です。

すべてのジオメトリタイプで、属性によるフィルターツールまたは範囲によるフィルターツールを使用してデータセットにフィルターを追加します。
ポリゴンジオメトリの場合、ジオメトリの単純化ツールを使用してジオメトリをジェネラライズします。

データセット全体をフィーチャレイヤーに書き込むには、データパイプラインを実行する前にフィルタリングツールや単純化ツールを削除してください。

データパイプラインの実行

キャンバスアクションバーの [実行] ボタンを使用して、構成された処理を実行します。データパイプラインを実行するには、少なくとも 1 つの出力フィーチャレイヤーエレメントが構成されている必要があります。実行結果とメッセージには、[実行の詳細] ボタンをクリックして、最新の実行詳細コンソールからアクセスできます。結果をクリックすると、アイテムページを開くことができます。

自動化されたスケジュールでデータパイプラインを実行するには、タスクを作成できます。データパイプラインのスケジュール設定されたタスクを作成する方法の詳細については、「データパイプラインタスクのスケジュール設定」をご参照ください。

データパイプラインへのメモの追加

メモを追加してワークフローをドキュメント化します。キャンバス内の特定のエレメントまたはデータパイプライン全般にメモを追加できます。

特定のエレメントにメモを追加するには、エレメントを選択し、エレメントアクションバーの [メモ] ボタンをクリックします。エレメントメモを追加したら、[メモ] ボタンを再度クリックしてメモを表示または編集できます。すべてのエレメントメモを表示するには、エディターツールバーの [メモ] ボタンをクリックし、[エレメントメモ] を選択します。ここで、エレメントメモを削除したり、メモをクリックしてキャンバスで開き、表示または編集できます。エレメントごとにメモを 1 つだけ含めることができます。エレメントメモの長さは 16,000 文字です。

通常、データパイプラインにメモを追加するには、エディターツールバーの [メモ] ボタンをクリックし、[一般的なメモ] を選択します。ここで、一般的なメモを作成、表示、編集、削除できます。データパイプラインごとに一般的なメモを 1 つだけ含めることができます。一般的なメモの長さは 16,000 文字です。

エレメントをコピーする場合、メモはエレメントと一緒にコピーされません。

メモを含む既存のデータパイプラインを新しいアイテムとして保存すると、メモは新しいアイテムとともに保存されます。

このトピックへのフィードバック

データ パイプライン エレメント

データ パイプライン ワークフロー

データへの接続

データ処理の実行

データ パイプライン エレメントのプレビュー

データ パイプラインの実行

データ パイプラインへのメモの追加

このトピックの内容

データパイプラインエレメント

データパイプラインワークフロー

データパイプラインエレメントのプレビュー

データパイプラインの実行

データパイプラインへのメモの追加