データのフェデレーションとカタログ フィードの管理

パブリック サイトの編集者は、ArcGIS Hub サイトで利用可能なフィードを使用して、サイトのパブリック コンテンツ カタログを外部カタログとフェデレートできます。 カタログ フィードは、データ カタログ間の相互運用性を促進し、検索エンジンまたはサード パーティ カタログでの見つけやすさを高めることができます。 管理者および訪問者はフィードに登録することで、コンテンツ カタログの変更を監視できます。

カタログ フィードの使用

Hub のフィードを使用すると、サイト カタログの変更 (新規コンテンツの追加など) を常に把握することができます。 カタログにパブリック アイテムがあるすべてのパブリック Hub サイトで、サイト フッターと検索インターフェイスに [フィードの探索] ボタンが表示されます。 すべてのパブリック サイトではデフォルトでフィードがオンになっていますが、サイト編集者はパブリック サイトのフィードをオフにすることができます。 [フィードの探索] ボタンを選択して、サイトのフィード URL および API の探索ページを表示します。 Hub は、次のフィードをサポートしています。

  • RSS (<siteURL>/api/feed/rss/2.0)
  • DCAT US 1.1 (<siteURL>/api/feed/dcat-us/1.1.json)
  • DCAT AP 2.1.1 (<siteURL>/api/feed/dcat-ap/2.1.1.json)
  • OGC API – Records (<siteURL>/api/search/definition)

RSS フィード

RSS (Really Simple Syndication) は、頻繁に更新されるコンテンツを標準的な方法で公開するために使用する Web フィード形式であり、ユーザーが自動的に更新に登録して受信できるようにします。 RSS フィードには、サイトで共有しているすべての一般公開コンテンツのタイトル、説明、公開日など、ハイレベルのメタデータが含まれています。 ユーザーは、検索カタログの変更に関する最新情報を入手したり、フィードを RSS リーダー (アグリゲーター) に取り込んで別のサイトでコンテンツを表示したりできます。 Hub は GeoRSS 仕様に準拠しています。

DCAT フィード

各サイトには、サイトを通じて共有するアイテムが格納されるコンテンツ カタログがあります。 DCAT を使用してカタログ コンテンツを記述すると、見つけやすさが高まり、アプリケーションが複数のカタログからメタデータにアクセスできるようになります。 さらに、カタログ間でのフェデレートされたデータセットの横断検索も可能になります。

サイトのカタログをフェデレートするには、すべてのパブリック Hub サイトに対して自動的に生成されるパブリック フィード出力 URL を共有します。 Hub では、DCAT US 1.1 と DCAT AP 2.1.1 の 2 つの DCAT フィードがサポートされています。 このカタログ フィード (例: www.yourhubsite.gov/api/feed/dcat-us/1.1.json) は DCAT US 1.1 に準拠します。 Hub の DCAT 構成エディターを使用して、サイトのカタログのコンテンツを編集することもできます。

ヒント:

パブリックに共有されているデータ アイテムとそのレイヤーだけが <DCAT type>.json カタログに入力されます。 組織内のプライベート コンテンツは、現在、DCAT カタログの方法で共有したりフェデレートしたりすることはできません。

OGC API - Records

OGC API - Records を使用して、標準化されたコレクションとリソースのメタデータから地理空間リソースを検出できます。 パブリック アイテムとプライベート アイテムを含む Hub サイトのカタログをプログラムによってクエリー、フィルター、検索できます (プライベート アイテムに有効なトークンがある場合)。 OGC API - Records エクスプローラーを使用すると、サイトのクライアント検索インターフェイスを使用せずに、API エンドポイントをテストしたり、カタログを検索したりすることができます。 一般的な使用法としては、ArcGIS Online Map Viewer、GIS デスクトップ アプリケーション、OWSLib など、他のツールでマップ上のフィーチャをレンダリングすることがあります。

フィードの構成と管理

フィードは、カタログにパブリック コンテンツが含まれているパブリック サイトで利用できます。 サイトの管理者は、DCAT US 1.1、DCAT AP 2.1.1、RSS のサイトの出力フィードに適用される属性と値を選択できます。 Hub のデフォルトの構成を維持するか、特定のフィールド/属性を自分で構成することができます。 フィード エディターに、データセットのメタデータと一致する有効なキーを入力する必要があります。 フィードはデフォルトで使用可能ですが、サイト ワークスペースでオフにすることができます。

フィードを構成および管理するには、次の手順を実行します。

  1. サイトを編集モードで開きます。
  2. [サイトの管理] 設定 ボタンを選択し、サイト ワークスペースを開きます。
  3. [設定] を選択し、[フィード] ウィンドウを選択します。
  4. フィードを有効にするには、[フィードの有効化] を選択します。 [フィード] で、フィード タイプを選択します。
  5. [構成] エディターで、コードをコピーして、カンマから最後の括弧までの間の任意の場所に貼り付けます。
    注意:

    一部の属性は編集できません。

    ヒント:

    RSS フィード テンプレートは構造が異なり、最上位のキーを追加することができません。

  6. [保存] を選択します。

RSS フィード構成

Hub サイト編集者は、表示するメタデータを選択できます。つまり、メタデータのデフォルト値をオーバーライドしたり、ユーザーの更新に最も重要な値を指定したりできます。 たとえば、サイト編集者は、コンテンツが更新されたときにハイライト表示するメタデータの値、簡単な説明、関連する地理的位置を構成できます。

DCAT デフォルト スキーマの例

Hub は、JSON に記述されたスキーマを使用して、対応するフィードの各レコードに表示されるメタデータのプロパティを決定します。 デフォルトの DCAT US 1.1 スキーマを以下に示します。 "title”: “{{name}}”“description”: {{description}} などのキー/値ペアを含みます。 フィードの各レコードには、キー (“title”) とテンプレート化された値 (“<item’s metadata title>”) があります。 スキーマの設計は、ArcGIS アイテム メタデータと DCAT US 1.1 規格の最も簡単なマッピングに基づいています。

DCAT デフォルト US 1.1 スキーマ

{
	"title": "{{name}}",
	"description": "{{description}}",
	"keyword": "{{tags}}",
	"issued": "{{created:toISO}}",
	"modified": "{{modified:toISO}}",
	"publisher": {
		"name": "{{source}}"
	},
	"contactPoint": {
		"fn": "{{owner}}",
		"hasEmail": "{{orgContactEmail}}"
	},
	"spatial": "{{extent}}"
}

DCAT US フィードと DCAT AP フィードの "spatial" 属性を編集できます。 Hub は新しいテンプレートでアイテムの範囲 (デフォルト) を使用します。 範囲値を持たないアイテムの場合、空間属性が削除されます。 "spatial" 値を代替の "spatial": "{{extent || 'SPATIAL_FALLBACK'}}" で上書きでき、デフォルトのテンプレートを更新できます。

DCAT カスタム スキーマの例

スキーマは、キー/値ペアを追加、更新、削除することで、カスタマイズできます。 フィードのタイプによっては、一部のキーは編集できません。 次のような変更が加えられたカスタム DCAT US 1.1 スキーマの例を以下に示します。

  • キー/値ペアの追加
  • キー/値ペアの更新
  • キー/値ペアのフォールバックの追加
ヒント:

パブリック Hub コンテンツの相互運用性と見つけやすさを追求するには、有効なフィードを維持することが重要です。 フィールドを追加または変更するときは、フィードが無効になる可能性がある (Hub はフィードを検証しない) ため、事前に適切なリソースをご参照ください。 フィードが無効であると、data.govdata.europa.eu などのサイト、およびフィードが使用される他の場所でカタログのコンテンツをフェデレートする際に問題が発生する可能性があります。 DCAT US 1.1 バリデーターDCAT AP バリデーターを使用してフィードをカスタマイズする前と後にフィードを検証してください。

DCAT カスタム US 1.1 スキーマ

{
 "title": "{{name}}",
"description": "{{description}}",
	"keyword": "{{tags}}",
	"issued": "{{created:toISO}}",
	"modified": "{{modified:toISO}}",
	"publisher": {
		"name": "{{source}}"
	},
	"contactPoint": {
		"fn": "{{owner}}",
		"hasEmail": "{{orgContactEmail}}"
	},
	"culture": "{{culture}}",
	"summary": "{{snippet}}",
	"platform": "ArcGIS Hub",
	"bureauCode": [
		"010:86",
		"010:04"
	],
	"programCode": [
		"015:001",
		"015:002"
	]
}
注意:

カスタム DCAT US 1.1 スキーマには、“culture”, “summary”, “platform”, “bureauCode”“programCode” などの 5 つの新しいキーが追加されています。 “culture” および “summary” キーは、Hub API の最新バージョンである OGC API - Records から取得されるテンプレート値をとります。 “platform”, “bureauCode” および “programCode” キーの値はリテラル文字列です。

カスタム値の例

組織のメタデータ規格に一致するよう、多くのサイトの管理者は、フィードに表示されるメタデータを調整する必要があります。 キーは、“title”“” などの任意のリテラル文字列をとることができますが、一般にターゲットのメタデータ規格に準拠している必要があります。 対応する値には、リテラル文字列、または OGC API - Records からキーを取得するテンプレートを使用できます。 テンプレートの場合は、OGC API - Records から返される (最上位またはネストされた) キーを入力できます。

たとえば、dc.esri.com の Hub フィード例には、“USA Weather Watches and Warnings” というタイトルのパブリック レイヤーがあります。OGC API - Records (https://hub.arcgis.com/api/search/v1/collections/all/items/c7a223914778420db8bf000b4eb6ec6f) または https://hub.arcgis.com/api/search/v1/collections/all/items?id=c7a223914778420db8bf000b4eb6ec6f を使用してレイヤーの ID: c7a223914778420db8bf000b4eb6ec6f にアクセスすることで、そのデータセットの JSON メタデータを参照できます。

上記の API レスポンス例にアクセスする場合は、以下のような記述で始まる JSON レスポンスをご参照ください。

カスタム値の例 DCAT US 1.1

"data": 
{
    "id": "c7a223914778420db8bf000b4eb6ec6f",
    "type": "dataset",
    "attributes": {
        "errors": [],
        "access": "public",
        "additionalResources": [],
  …
}

下方にスクロールすると、“created” (コンテンツの作成日付を示す) など、エディターで選択してテンプレート値として使用するキーがさらに表示されます。 OGC API - Records の値を使用するには、フィード エディターで、“attributes” の下に OGC API - Records キーのテンプレート値を追加します。 たとえば、次のようにフィード レコードに “created” を含める必要があるとします。

カスタム値の例 DCAT US 1.1

{
…
 	"bureauCode": ["010:86","010:04"],
 	"programCode": ["015:001","015:002"],
 	"created": 1610151009000,
…
}
この同じ例では、カスタム DCAT US 1.1 スキーマに次の行を追加します。
{
…
  "bureauCode": [
   "010:86",
   "010:04"
],
  "programCode": [
   "015:001",
   "015:002"
],
  "created": "{{item.created}}"
…
}

コンテンツの管理者は、追加のカスタム配布を含めるようにフィードを構成できます。 これらは、コンテンツ アイテムのダウンロード可能なリソースに対して Hub が自動的に生成する既存の配布に追加されます。

Hub のフィードによるカタログのフェデレーション

Hub フィード エディターを使用することで、サイトの管理者はデータを記述する方法を標準化できます。 サイトの管理者は、データを取り込む前に、フィードの各データセットに対して、表示するメタデータの値を選択できます。

Data.gov とのフェデレーション

米国では、出力を変更して、国の Data.gov カタログなど、特に大規模なデータ クリアリングハウスを操作できます。 この種の相互運用性により、サード パーティのアグリゲーターに、データセットに利用できる複数の配布を指定することができます。 配布は、Web サービス、ダウンロード、API として使用するために用意されている形式です。

サイト編集者は、サイトの DCAT US 1.1 出力フィードに適用される属性と値を選択できます。 フィード エディターに、データセットのメタデータと一致する有効なキーを入力する必要があります。

CKAN とのフェデレーション

組織が CKAN などのカタログ化ソフトウェアを使用している場合、またはカタログ化ソフトウェアを使用している他の組織と共同作業している場合、Hub サイトのデータ カタログをフェデレートできます。 データの取得をサポートするように、CKAN インスタンスを適切に構成する必要があります。 最初に、CKAN チームが開発および保守し、Data.gov やその他のユーザーがデータセットの取り込みに使用する 2 つのエクステンション (CKAN Harvesting エクステンションCKAN DCAT エクステンション) をインストールおよび構成します。

これらのエクステンションがインストールされていることを確認した後、Harvester の Gather_Consumer サービスと Fetch_Consumer サービスがバックグラウンド サービスとして動作していることを確認します。 詳細については、CKAN のドキュメントをご参照ください。

ArcGIS Hub カタログの取り込み

カタログを取り込むには、次の手順に従います。

  1. http://yourCKANinstance/harvest で、CKAN 取り込み管理ページに移動し、サイン インします。
  2. [取り込みソースの追加] を選択し、Hub サイトに関する情報を入力します。
    • <siteURL>/api/feed/dcat-us/1.1.json を使用して URL を入力します。
    • 取り込みソースに、サイトの名前と似たタイトルを付けます。 (オプション) 説明ボックスを入力します。
    • ソース タイプに [DCAT JSON harvester] を選択します。
    • 更新頻度に [手動] を選択します。
    • [保存] を選択します。
  3. [Admin] を選択し、[Reharvest] を選択します。
  4. CKAN インスタンスで取り込みジョブを実行します。

    CKAN で .json ファイルが処理され、すべてのデータセットが取り込まれます。 取り込みソースに、取り込まれた内容が表示されます。 Hub から取得した説明、タグ、ダウンロード形式の配布を含むアイテムおよびレイヤーのメタデータが CKAN のインスタンスからアクセス可能になります。

注意:

カタログ フィードでは、自動的にダウンロード API v1 が使用されます (以前に使用されていたダウンロード API は非推奨となりました)。