ビッグデータ解析の設計—ArcGIS Velocity

このレッスンのステップでは、ArcGIS Velocity を使用してビッグデータ解析を作成する方法について説明します。例では、運輸計画担当者として、自転車運転者が巻き込まれた数年間分の自動車事故について詳しい情報を得ます。得られた知見を基に、自転車レーンやレーンバリアなどの自転車に優しい新規インフラストラクチャをどこに建設すれば自転車運転者の安全性に最大の効果があるかを見極めます。

手順に沿って、ビッグデータ解析およびそのデータソースの構成、ツールの構成、および Web マップで表示可能な解析結果が含まれている出力フィーチャレイヤーの生成を行います。

このレッスンは初心者向けに設計されています。 Velocity にアクセス可能な ArcGIS Online のアカウントが必要です。このレッスンの所要時間の目安は 30 分です。

ビッグデータ解析の作成

作業を開始するには、次の操作を実行します。

ArcGIS Velocity を Web ブラウザーで開いて、Velocity のライセンスを受けているArcGIS Online アカウントでサインインします。
Google Chrome または Mozilla Firefox を使用することをお勧めします。
注意:
サインインで問題が発生した場合は、ArcGIS 組織の管理者にお問い合わせください。 ArcGIS Velocity を使用する権限がある ArcGIS Online ロールの割り当てが必要な場合があります。
役割の作成とユーザー割り当ての詳細
[ホーム] ページが表示されます。
[解析] の下の [ビッグデータ] タブをクリックして [ビッグデータ解析] ページにアクセスします。
ヒント:
[ホーム] ページの [はじめに] セクションには、[ビッグデータ解析] の下に [ビッグデータ解析の作成] ショートカットボタンがあります。
[ビッグデータ解析] ページで、既存のビッグデータ解析に対して次のアクションを実行できます。
- 確認
- 作成
- 開始
- 停止
- ステータスを確認
- 編集
- クローン
- Delete キー
[ビッグデータ解析の作成] をクリックします。
構成ウィザードが開き、データソースタイプのオプションが表示されます。

Velocity にサインインし、構成ウィザードでビッグデータ解析を作成するプロセスを開始しました。次のステップはそのデータソースを構成することです。

データソースの構成

このレッスンで使用されているデータは New York City (NYC) OpenData サイトからダウンロードできます。 150 万件以上のレコードが含まれている完全なデータセットがこのサイトから CSV 形式でダウンロードされました。このレッスン用に、この CSV ファイルがパブリック Amazon S3 バケットでホストされており、接続情報は以下の各ステップで示しています。

ビッグデータ解析にはデータソースが必要です。データソースを構成するには、以下の手順を実行します。

[データソースのタイプの選択] ステップで、[クラウド] カテゴリの [すべて表示] をクリックします。
注意:
すべてのビッグデータ解析に少なくとも 1 つの入力データソースが必要です。
[クラウドオプション] で、[Amazon S3] を選択します。
Azure Blob Store、Azure Cosmos DB、またはAmazon S3の詳細。
[Amazon S3 の構成] ダイアログボックスの [Amazon S3 バケットの構成] ステップで、パラメーターを次のように設定します。
1. [アクセスモード] で [パブリック] を選択します。
2. [バケット名] に「arcgis-velocity-public」と入力します。
3. [地域] で、[米国西部 (オレゴン)] を選択します。
4. [フォルダーパス (オプション)] に「/nyc-motor-vehicle-collisions」と入力します。
5. [データセット] に「NYPD_Motor_Vehicle_Collisions.csv」と入力します。
[次へ] をクリックして、Amazon S3 バケットパラメーターを適用します。
データソースは、サンプリングされたイベントデータを整合チェックして確認用に返します。次のステップはデータスキーマを確認することです。

データスキーマの確認

Amazon S3 バケットパラメーターを設定した後は、データスキーマを確認できます。データソースを構成する際には、読み込むデータのスキーマを定義することが重要です。 Velocity は、ソースデータをサンプリングする際に、[データ形式]、[フィールド区切り文字]、[フィールドタイプ]、[フィールド名] などのスキーマを定義します。

[スキーマの確認] ステップで、データのスキーマが下図と同様であることを確認して確定します。
Velocity はデータソースへの接続をテストし、最初のいくつかのデータレコードをサンプリングし、サンプリングされたレコードに基づいてデータのスキーマを解釈しています。有効なスキーマとなるように、[データ形式]、[フィールド区切り文字]、[フィールドタイプ]、および [フィールド名] 値を必要に応じて変更できます。このレッスンの目的では、スキーマのデフォルトパラメーターをそのまま使用します。
[次へ] をクリックしてサンプリングされたスキーマを確認します。

構成ウィザードは次のステップに進みます。

キーフィールドの識別

このステップでは、[位置]、[日付と時刻]、および [トラッキング] パラメーターの値を選択することによって、Velocity が空間および時間の機能用のフィールドを指定し、ジオメトリ、日付情報、およびデータの一意の識別子を適切に構築できるようにします。

キーフィールドを識別するには、次の手順を実行します。

[位置情報の種類] で、[X/Y フィールド] を選択します。
[X (経度)] で、[経度] を選択します。
[Y (緯度)] で、[緯度] を選択します。
[高度 (Z)] で、[なし] を選択します。
[空間参照] は、デフォルトの [GCS WGS 1984] 値をそのままにします。
[データに日付フィールドがありますか？] で、[いいえ] を選択します。
このパラメーターを使用して、データソース内の開始/終了の日付または日時フィールドを設定できます。受信データの日付情報が文字列形式である場合、日付形式を指定する必要があります。このレッスンでは、日付や時刻の情報は指定されていません。
日時パラメーターの詳細
[Track ID] で、[データに Track ID がありません] を選択します。
このパラメーターを使用して、データソース内の Track ID フィールドを指定できます。このレッスンでは、Track ID を定義しません。
[完了] をクリックして新しいデータソースを作成します。

新しい [Amazon S3] データソースが解析エディターに追加されます。

ビッグデータ解析の作成

解析エディターに追加されたばかりのデータソースを使用して、ビッグデータ解析を作成できます。

[新しいビッグデータ解析] ページで、[解析の作成] をクリックします。
[解析の作成] ダイアログボックスが表示されます。
[タイトル] に、「NYC Cyclist Accidents」と入力します。
[サマリー] に「Process motor vehicle accidents to identify and analyze those involving cyclists」と入力します。
[フォルダー] で、ビッグデータ解析を作成するフォルダーを選択します。
[解析の作成] をクリックして解析を作成します。

解析エディターが再表示され、ツールバーに追加のオプションが表示されます。

解析へのツールの追加

新しい解析を作成した後は、ニューヨーク市における自転車事故データに関するビッグデータ解析を実行するツールをこの解析に追加できます。 Velocity を使用して解析パイプラインを構成できます。

最初に、フィールド演算ツールを追加して TotalCyclistCasualties フィールドを追加します。このフィールドには、データソースの各レコードの NUMBER_CYCLIST_INJURED フィールドと NUMBER_CYCLIST_KILLED フィールドの値の合計を格納します。

以下のステップを実行して、自転車運転者が負傷した自動車事故について詳しい情報を得るための順次ツールを構成します。

[ノードの追加] メニューで [データの管理] をクリックし、[フィールド演算] ツールを選択します。
[フィールド演算] ツールが、解析エディターに追加されます。
[Amazon S3] データソースを [フィード演算] ツールに接続します。
必要に応じて、解析エディターでツールとデータソースの位置を変更して、接続を容易にします。接続すると、[フィールド演算] ツールは使用するデータソースを認識できるようになります。
[フィールド演算] ツールをダブルクリックしてプロパティにアクセスします。
[フィールド演算の追加] をクリックして、[新しいフィールド] を選択します。
[フィールド] に「TotalCyclistCasualties」と入力します。
[タイプ] ドロップダウン矢印をクリックして、[Int64] を選択します。
この指定により、フィールドタイプは 64 ビット整数フィールドになります。
[Arcade 条件式の構成] をクリックして、[Arcade 条件式の構成] ダイアログボックスを開きます。
1. Arcade 式ビルダーを使用し、$feature.NUMBER_CYCLIST_INJURED+$feature.NUMBER_CYCLIST_KILLED と入力します。
2. [実行] をクリックして Arcade 式を実行します。
  結果は以下の図のようになります。
3. [OK] をクリックして式を保存します。
4. [フィールド演算の追加] をクリックして、新しいフィールド演算を [フィールド演算] ツールに追加します。
  ヒント:
  必要なフィールド演算を追加できます。このレッスンでは 1 つのフィールド演算のみを使用します。
5. [適用] をクリックして、[フィールド演算] ツールのプロパティを演算に適用します。
[フィールド演算] ツールが設定され、[Amazon S3] データソースに接続されます。次に、ニューヨーク市の自動車事故データにフィルターを適用して、自転車運転者が負傷または死亡し、有効な位置座標がある事故を特定できます。
解析エディターで [保存] をクリックし、ビッグデータ解析の構成を保存します。
[ノードの追加] メニューで [データの管理] をクリックし、[式によるフィルター処理] ツールを選択します。
式によるフィルター処理ツールが解析エディターに追加されます。
[式によるフィルター処理] ツールを [フィールド演算] ツールの後ろにドラッグしてドロップし、2 つのノードを接続します。
[式によるフィルター処理] ツールをダブルクリックしてそのプロパティを開き、次のように構成します。
1. [Arcade 条件式の構成] をクリックして、[Arcade 条件式の構成] ダイアログボックスを開きます。
2. Arcade 式の設定機能を使用するか「$feature.TotalCyclistCasualties>0&$feature.LATITUDE>0」と入力します。
  このデータセットには、座標が無効なレコードがあります。緯度の値が 0 以下であるレコードをフィルターで除外すると、このようなレコードを無視できます。
3. [実行] をクリックして Arcade 式を実行します。
  結果は以下の図のようになります。
4. [OK] をクリックして [式によるフィルター処理] ツールのプロパティに戻ります。
5. [適用] をクリックして式を適用します。
  フィルターが追加されます。次に、自転車運転者が負傷または死亡した事故の件数を規則的な六角形のビンとして表すため、ポイントを空間的に集約する [ポイントの集約] ツールを追加します。
[ノードの追加] メニューで [データの集約] をクリックして、[ポイントの集約] ツールを選択します。
[ポイントの集約] ツールが解析エディターに追加されます。
解析エディターで [保存] をクリックし、更新されたビッグデータ解析の構成を保存します。
[ポイントの集約] ツールを [式によるフィルター処理] ツールの後ろにドラッグし、2 つのノードを接続します。
[ポイントの集約] ツールをダブルクリックしてそのプロパティを開き、次のように構成します。
1. [ポイントの集約] で、[ビン] を選択します。
2. [ビンタイプ] で、[六角形] を選択します。
3. [ビンサイズ] に「250」と入力し、測定単位は [メートル] のままにします。
4. [時間ステップ] セクションをそのままにし、[サマリーフィールド] セクションで [サマリーフィールドの追加] をクリックします。
  [プロパティ] ウィンドウが表示されます。
5. [属性] で、[TotalCyclistCasualties] を選択します。
6. [統計情報] で [合計] を選択します。
7. [出力フィールド名] は、デフォルトの [TotalCyclistCasualties_Sum] のままにします。
8. [サマリーフィールドの追加] をクリックして集計フィールドを追加します。
9. [適用] をクリックしてツールプロパティを適用します。

事故データを処理する 3 つの解析ツールが正常に追加されました。次に、出力を追加します。

解析に出力を追加します。

データソースと解析ツールが作成されたので、このレッスンの最後のステップとして、処理されたイベントデータを、Web マップで視覚化できるフィーチャレイヤーに送信する出力を追加します。

出力を追加するには、次の手順に従います。

[ノードの追加] メニューで [出力] をクリックし、[フィーチャレイヤー (新規)] を選択します。
[フィーチャレイヤーの構成 (新規)] ダイアログボックスが表示されます。
[フィーチャレイヤーの構成] ステップで、プロパティを次のように構成します。
1. [時空間フィーチャレイヤーにデータを保存] オプションをオンにします。
2. [データ格納法] で、[すべての新しいフィーチャの追加] を選択します。
  トラッキング ID が定義されているデータソースを使用している場合は、格納法として [各トラッキング ID 値に対し、最新のフィーチャのみを保持します] を使用します。この格納法では、特定の Track ID の新しいフィーチャが受信されるたびに、その Track ID に関連付けられている、格納されているフィーチャが新しいフィーチャに置き換えられます。
3. [解析の実行ごと] で、[既存のフィーチャおよびスキーマを置換] を選択します。
  [既存のフィーチャおよびスキーマを置換] を選択する場合、ビッグデータ解析が実行されるたびに、出力フィーチャレイヤー内のフィーチャとスキーマが上書きされます。これは、ビッグデータ解析の作成中、解析の実行と実行の間にツールを追加、削除、または変更する場合に便利です。ビッグデータ解析を実行するたびにレコードを追加する場合は、[既存のフィーチャおよびスキーマを保持] オプションが便利です。
[次へ] をクリックします。
[保存] ステップで、[フィーチャレイヤー名] に「Cyclist_Accident_Aggregation」と入力します。
[フィーチャレイヤーのサマリー] に「NYC cyclist accident aggregated feature layer」と入力します。
[フォルダー] で、フィーチャレイヤーを保存するフォルダーを選択します。
[完了] をクリックして、新しい出力を保存します。
新しい [Cyclist_Accident_Aggregation] 出力が解析エディターに追加されます。
[Cyclist_Accident_Aggregation] 出力を [ポイントの集約] ツールの後ろにドラッグし、2 つのノードを接続します。
ヒント:
ノードを移動して、モデルの外観を見やすく整えます。
[保存] をクリックして [NYC Cyclist Accidents] ビッグデータ解析を保存します。

ビッグデータ解析を開始

必要なノードが追加されたビッグデータ解析が正常に構成されたので、解析を開始できます。この解析は、定義されているスキーマを使用して CSV ファイルから 150 万件余りのレコードを読み込んで、各種ツールを介してイベントデータを処理し、解析出力を新しいフィーチャレイヤーに書き込みます。

次の手順を実行して解析を一度実行します。

解析エディターで [開始] をクリックして [NYC Cyclist Accidents] ビッグデータ解析を開始します。
[開始] ボタンが [初期化の停止] ボタンに変わってから [停止] ボタンに変わり、解析が開始して実行中であることがわかります。
注意:
Velocity のフィードとリアルタイム解析は、いったん開始されると実行し続けます。一方ビッグデータ解析では、解析は完了するまで続けられ、完了すると自動的に停止します。解析エディターの [スケジュール] ドロップダウンメニューで表示されるオプションを使用して、ビッグデータ解析を繰り返し実行するように構成できます。オプションにより、解析を 1 回、定期的に、または繰り返し実行することができます。
繰り返し実行するビッグデータ解析のスケジュール設定の詳細
[停止] ボタンが [開始] に戻るまで解析を監視します。
これはその解析が 1 回実行されて完了し、現在は実行されていないことを示しています。 [ビッグデータ解析] ページから、ビッグデータ解析のステータスを監視することもできます。

Web マップでの解析結果の確認

前のセクションでビッグデータ解析を開始したときに、出力フィーチャレイヤーが作成されました。その出力フィーチャレイヤーを Web マップで開き、ニューヨーク市の自転車事故データに関するビッグデータ解析の結果を確認します。

メインメニューで、[出力] の下の [レイヤー] タブをクリックして [レイヤー] ページを開きます。
リストで [Cyclist_Accident_Aggregation] フィーチャレイヤーを見つけて、[Map Viewer で開く] アイコンをクリックしてこのフィーチャレイヤーを Web マップで確認します。
注意:
リアルタイム解析およびビッグデータ解析によって作成された出力レイヤーは、解析が実行されて出力が生成されるまでは [レイヤー] ページに表示されません。
Map Viewer Classic の上部にある [Map Viewer で開く] をクリックして、[Cyclist_Accident_Aggregation] フィーチャレイヤーを Map Viewer　で表示します。
米国ニューヨーク市のデータにズームインします。
[コンテンツ] (ダーク) ツールバーで、[ベースマップ] をクリックし、ベースマップを [キャンバス (ダークグレー)] に変更します。
[Cyclist_Accident_Aggregation] フィーチャレイヤーで、[スタイル] をクリックします。
[属性の選択] で、ドロップダウンメニューから [カウント] を選択し、[追加] をクリックします。
[スタイルの選択] で [数と量 (色)] を選択し、必要に応じて [スタイルオプション] をクリックします。
[スタイルオプション] で、[シンボルスタイル] をクリックします。 [色] で、カラーランプを赤と黄色に変更します。色を調整したら、[完了] をクリックしてシンボルスタイルを閉じます。
[スタイルオプション] の最後までスクロールし、[データの分類] ボタンを切り替えてデータをグループ化し、自転車運転者に関連する負傷が多い地域をハイライト表示します。
[データの分類] 切り替えボタンの下にある [メソッド] ドロップダウン矢印をクリックします。 [標準偏差] を選択し、クラスサイズを標準偏差 [1] に設定します。
その他のプロパティはデフォルトのままにしてから、[終了] をクリックします。

Web マップが設定され、表示できるようになります。 Web マップを画面移動したりズームしたりしてビッグデータ解析の結果を調査し、自転車運転者に関連する負傷と死亡の件数が他の地域よりも多い地域と少ない地域を特定できます。

参考資料

このレッスンでは、約 150 万件の自転車運転者の事故を解析するビッグデータ解析を作成して実行し、ニューヨーク市で最も事故の件数が多い地域を特定しました。これらの結果により、自転車関連の新しいインフラストラクチャをどこに設置すると最大の効果が得られるかについて、より詳しい情報をもとに決断を下すことができるようになりました。

引き続き Velocity を操作するにあたり、以下の追加リソースを利用できます。

このトピックへのフィードバック

ビッグ データ解析の作成

注意:

ヒント:

データ ソースの構成

注意:

データ スキーマの確認

キー フィールドの識別

ビッグ データ解析の作成

解析へのツールの追加

ヒント:

解析に出力を追加します。

ヒント:

ビッグ データ解析を開始

注意:

Web マップでの解析結果の確認

注意:

参考資料

このトピックの内容

ビッグデータ解析の作成

データソースの構成

データスキーマの確認

キーフィールドの識別

ビッグデータ解析の作成

ビッグデータ解析を開始