ビッグデータ解析—ArcGIS Velocity

ビッグデータ解析は、フィーチャレイヤー内または Amazon S3、Azure Blob Store のようなクラウドビッグデータストア内のデータなどの保存されたデータに対して、バッチ解析および処理を実行します。ビッグデータ解析は、一般的に、観測値の集計、パターン解析の実行、データの情報付加に使用されます。実行できる解析は、以下の Velocity のツールカテゴリのツールを使用します。

パターンの解析
データへの情報付加
位置の検索
データの管理
データの集計
近接性の使用

例

環境科学者として、数百万個の静的なセンサーのレコードのデータセット内で、国全体のオゾン濃度が高い時間および位置を識別することができます。
小売りアナリストとして、指定した時間範囲内で数百万個の匿名の携帯電話の位置を処理し、店舗の位置から特定の距離の範囲内の潜在的消費者の数を決定できます。
GIS アナリストとして、5 分ごとに新しいフィーチャについてデータソースをチェックし、特定の属性または空間条件が満たされた場合に通知を送信する、繰り返し実行するビッグデータ解析を実行できます。

ビッグデータ解析のコンポーネント

ビッグデータ解析には、以下の 3 つのコンポーネントがあります。

ソース
- ビッグデータ解析では、静的データまたはほぼリアルタイムのデータを読み込むために、データソースが使用されます。多くのデータソースタイプを利用できます。ソースおよび使用可能なソースタイプの詳細については、「データソースとは」をご参照ください。
- 解析では、複数のデータソースが存在することができます。
ツール
- ツールは、ソースから読み込まれたデータを処理または解析します。
- ビッグデータ解析では、複数のツールが存在することができます。
- ツールを互いに接続することができ、その場合、1 つのツールの出力が次のツールの入力を表します。
出力
- 出力は、ビッグデータ解析処理の結果で何が実行されるべきかを定義します。
- 新規または既存のフィーチャレイヤーへのフィーチャの格納、Amazon S3 または Azure Blob Storage 内のクラウドレイヤーへのフィーチャの書き込みなどの、使用可能な多くの出力オプションがあります。詳細については、「出力の概要」および「解析出力の基礎」をご参照ください。
- ツールまたはソースの結果を複数の出力に送信することができます。

出力の操作

リアルタイム解析またはビッグデータ解析が実行されると、1 つ以上の出力が生成されます。構成された出力のタイプに応じて、ArcGIS Velocity でそれらの出力にアクセスして操作できる複数の方法があります。

ArcGIS のフィーチャレイヤー出力およびストリームレイヤー出力

リアルタイム解析またはビッグデータ解析がフィーチャレイヤー出力またはストリームレイヤー出力を作成する場合、Velocity でそれらの出力レイヤーを操作できます。なお、解析がまだ実行されていない場合は、これらの方法を使用できません。

解析でのフィーチャレイヤー出力およびストリームレイヤー出力へのアクセス

すでに実行され、出力レイヤーが正常に作成された解析を編集する場合は、解析エディターでフィーチャレイヤーまたはストリームレイヤーのノードを右クリックし、使用可能なオプションを表示します。オプションには、ノードのプロパティへのアクセス、ノードラベルの変更、アイテムの詳細の表示、マップビューアーまたはシーンビューアーでレイヤーを開く、ノードデータのサンプリング、ノードの削除などがあります。

レイヤーページからフィーチャレイヤー出力およびストリームレイヤー出力へのアクセス

リアルタイム解析およびビッグデータ解析によって作成されたすべてのフィーチャレイヤー、マップイメージレイヤー、およびストリームレイヤーは、Velocity のレイヤーページに表示されます。そこでは、既存レイヤーを編集する、それらのレイヤーをマップビューアーで表示する、アイテム詳細にアクセスして表示する、REST サービスディレクトリのレイヤーを開く、レイヤーを削除/共有するなどの作業を行うことができます。

Amazon S3 出力および Azure Blob Store 出力

ビッグデータ解析は、出力フィーチャを Amazon S3 クラウドストレージまたは Azure Blob Store クラウドストレージに書き込むことができます。ビッグデータ解析が終了すると、各クラウドの場所で、データが使用可能になります。期待どおりの出力を得られない場合は、[ログ] タブで解析のログを確認してください。

その他すべての出力

ビッグデータ解析のその他の出力タイプとして、[電子メール] および Kafka があります。これらの出力を使用すると、Velocity は、選択された出力との接続を確立し、それに応じてイベントデータを出力に送信します。

ビッグデータ解析の実行 (スケジュール)

ビッグデータ解析は、2 つの実行方法のいずれかを構成でき、1 回実行する、またはスケジュールを設定して実行することができます。実行の設定を変更した場合は、必ず [適用] をクリックしてビッグデータ解析に変更を保存してください。

1 回実行

一度だけ実行されるように構成されたビッグデータ解析は、ユーザーがビッグデータ解析を開始したときのみ実行されます。この解析は、定義されたとおりに処理および解析を実行し、完了後に停止状態に戻ります。この解析は、開始後に実行を継続するフィード、リアルタイム解析、およびスケジュール済みのビッグデータ解析とは異なります。 [1 回実行] は、ビッグデータ解析のデフォルトのオプションです。

スケジュールボタンの実行の設定で 1 回実行を選択

スケジュール済み

定期的に (たとえば、5 分ごとに) 実行するか、繰返し (たとえば、毎日午前 4 時に) 実行するように、ビッグデータ解析をスケジュール設定することができます。

スケジュールボタンの実行の設定で 5 分ごとに繰返し実行を選択

スケジュール済みの方法で実行するようにビッグデータ解析を構成した場合、解析が開始されると、その解析は、停止されない限り開始されたままになります。リアルタイム解析とは異なり、開始されたスケジュール済みのビッグデータ解析は、解析を実行しているときにのみリソースを消費します。たとえば、ビッグデータ解析が 1 時間ごとに定期的に実行されるようにスケジュール設定され、解析が完了するのに 4 分かかる場合、このビッグデータ解析は、1 時間に一度、解析を実行するのにかかる 4 分の間だけリソースを消費します。

ビッグデータ解析のスケジュールを設定する方法については、「繰り返し実行するビッグデータ解析のスケジュール設定」をご参照ください。

ほぼリアルタイムの解析の実行

スケジュール済みのビッグデータ解析を使用して、ほぼリアルタイムの解析を実行できます。その場合、ビッグデータ解析は、最後の実行以降にフィーチャレイヤーに追加された最新のフィーチャのみを処理します。ほぼリアルタイムの解析のユースケースおよび構成のオプションの詳細については、「ほぼリアルタイムの解析の実行」をご参照ください。

設定の実行

ビッグデータ解析では、ユーザーが [実行の設定] を調整できます。これらの設定は、自分の Velocity 配置により提供される、解析処理用のリソース割り当てを制御します。設定の実行に変更を加えた後で、必ず解析を保存してください。

一般的に、解析により多くのリソースを割り当てるほど、処理の完了と結果の生成を高速に行えます。大きなデータセットや複雑な分析を使用するときは、解析で利用可能なリソース割り当てを増やすことが最善で、時には必須となります。

反対に、[中 (デフォルト)] の設定で正常に実行できるような少数のフィーチャの単純な解析を行う場合は、実行設定のリソース割り当てを [小] の設定に減らすことを検討してください。これにより、Velocity 配置でより多くのフィード、リアルタイム解析、ビッグデータ解析が実行可能になります。

ビッグデータ解析のリソースの割り当ての実行設定

検討事項および制限事項

ビッグデータ解析を使用する際には、以下の点に注意してください。

ビッグデータ解析は、大量のデータを操作すること、およびパターンと傾向を集計することに対して最適化されています。その結果、通常は、入力フィーチャの数と比較して出力フィーチャまたはレコードの数が減少します。
ビッグデータ解析は、1 回の実行で大量のフィーチャを読み込むことまたは書き込むことに対しては、最適化されていません。ビッグデータ解析を使用して数千万個以上のフィーチャを書き込むと、長い実行時間がかかることがあります。
ベストプラクティスとして、データをコピーすることとは対照的に、集計および解析にビッグデータ解析を使用することをお勧めします。
ArcGIS Velocity の Standard および Advanced ライセンスで利用できる [大] の実行設定は、1 回実行設定でのみ使用できます。

このトピックへのフィードバック

ARCGIS

機能

ArcGIS の購入

業種

サポートとサービス

セルフサービス

Esri に連絡

Esri ストーリー

Esri について

GIS について