Federar datos y administrar fuentes

Los administradores del sitio pueden utilizar los feeds disponibles para un sitio de ArcGIS Hub para federar el contenido público del sitio con catálogos externos y aumentar el descubrimiento a través de motores de búsqueda y catálogos de terceros. Los administradores y los visitantes pueden utilizar feeds para estar al día de los cambios en el catálogo del sitio.

Utilizar feeds de catálogo

Puede utilizar los feeds de ArcGIS Hub para estar al tanto de los cambios en el catálogo del sitio, como la incorporación de contenido nuevo. Para todos los sitios públicos de Hub con elementos públicos en su catálogo, aparece el botón Explorar fuentes en el pie de página del sitio y la interfaz de búsqueda. Al seleccionarlo se abre una visualización de los feeds y el código necesarios para agregar cada uno de ellos. Hub admite los siguientes feeds:

  • DCAT US 1.1 (<siteURL>/api/feed/dcat-us/1.1.json)
  • DCAT AP 2.1.1 (<siteURL>/api/feed/dcat-ap/2.1.1.json)
  • API Records del OGC (<siteURL>/api/search/definition)
  • RSS (<siteURL>/api/feed/rss/2.0)

Feeds DCAT

Cada sitio tiene un catálogo (biblioteca de contenido) con el contenido que se desea compartir en todo el sitio. Para federar el catálogo de su sitio, puede compartir una URL de salida de feed pública que se genera automáticamente para cada sitio público de Hub. Hub admite dos feeds DCAT: DCAT US 1.1. y DCAT AP 2.1.1. Este feed de catálogo (por ejemplo, www.yourhubsite.gov/api/feed/dcat-us/1.1.json) se ajusta a DCAT US 1.1. También puede editar el contenido del catálogo de su sitio utilizando el editor de configuración de DCAT de Hub.

Precaución:

Solo los elementos de datos que se comparten públicamente rellenan el catálogo <DCAT type>.json. Actualmente, el contenido privado de su organización no se puede compartir ni federar a través del método de catálogo de DCAT.

Nota:

El catálogo de datos de cada sitio genera una URL de salida de feed pública que se ajusta a DCAT US 1.1 en <siteURL>/data.json. A principios de 2022, ArcGIS Hub migró oficialmente a un nuevo extremo en <siteURL>/api/feed/dcat-us/1.1.json. Lea el blog Cambios de configuraciones DCAT en sitios de ArcGIS Hub para obtener más información.

API Records del OGC

Puede utilizar la API Records del OGC para descubrir recursos geoespaciales mediante metadatos de recursos y colecciones estandarizados. Con este feed, puede consultar, filtrar y buscar mediante programación en el catálogo de un sitio de Hub. Utilice este explorador para probar extremos de API y hacer búsquedas en un catálogo sin tener que utilizar la interfaz de búsqueda del cliente del sitio. Algunos casos de uso habituales son la representación en pantalla de las entidades de un mapa en otras herramientas como ArcGIS Online Map Viewer, aplicaciones de escritorio de SIG y OWSLib, entre otras.

Fuentes RSS

RSS es un formato de redifusión de contenido web y una forma estándar de difundir metadatos sobre entradas de catálogo, especialmente para catálogos incorporados o actualizados frecuentemente. Las fuentes RSS contienen metadatos de alto nivel como el título, la descripción y la fecha de publicación de todo el contenido disponible públicamente compartido en el sitio. Los editores del sitio de Hub pueden elegir los metadatos que se mostrarán, es decir, invalidar los valores de metadatos predeterminados y proporcionar valores que sean más importantes para las actualizaciones de los usuarios. Por ejemplo, el editor de un sitio puede configurar los valores de metadatos para resaltar cuándo se ha actualizado contenido, una breve descripción y la ubicación geográfica asociada. Los usuarios pueden estar al día de los cambios en un catálogo de búsqueda o incorporar el feed en un lector de RSS (agregador) para mostrar el contenido en otro sitio.

Configurar y administrar feeds

Los administradores de sitios pueden elegir qué atributos y valores se aplican al feed de salida de un sitio para DCAT US 1.1, DCAT AP 2.1.1 y RSS. Puede mantener la configuración predeterminada de ArcGIS Hub o puede configurar ciertos campos o atributos personalmente. En el editor de feed, debe proporcionar claves válidas correspondientes a los metadatos de un dataset.

  1. Seleccione el botón editar para abrir el sitio en el modo de edición.
  2. Seleccione para abrir el menú del sitio en la barra de navegación superior y elija Biblioteca de contenido.
  3. Seleccione el botón Más acciones más acciones y elija Configurar fuentes.
  4. Seleccione un feed para configurar. En el editor de Configuración, copie y pegue su código en cualquier lugar, después de una coma y antes del último corchete.
  5. Seleccione Guardar.

Ejemplo de esquema predeterminado

ArcGIS Hub utiliza un esquema escrito en JSON para determinar qué propiedades de metadatos aparecen para cada registro en el feed correspondiente. A continuación, se muestra el esquema DCAT US 1.1 predeterminado. Contiene pares de clave/valor como "title”: “{{name}}” y “description”: {{description}}. Para cada registro del feed, verá la clave ("title") y el valor de plantilla ("<item’s metadata title>"). El diseño del esquema se basa en la representación cartográfica más sencilla entre los metadatos del elemento de ArcGIS y el estándar DCAT US 1.1.

Esquema DCAT US 1.1 predeterminado

{
	"title": "{{name}}",
	"description": "{{description}}",
	"keyword": "{{tags}}",
	"issued": "{{created:toISO}}",
	"modified": "{{modified:toISO}}",
	"publisher": {
		"name": "{{source}}"
	},
	"contactPoint": {
		"fn": "{{owner}}",
		"hasEmail": "{{orgContactEmail}}"
	},
	"spatial": "{{extent}}"
}

Puede editar el atributo "spatial" de los feeds DCAT US y DCAT AP. Hub utilizará la extensión del elemento (de forma predeterminada) en las nuevas plantillas. Para elementos sin valor de extensión, se elimina el atributo espacial. Puede anular el valor "spatial" con una alternativa: "spatial": "{{extent || 'SPATIAL_FALLBACK'}}" y actualizar la plantilla predeterminada.

Ejemplos de esquema personalizados

Puede personalizar el esquema agregando, actualizando o eliminando pares de clave/valor. Algunas claves no se pueden editar, en función del tipo de feed. A continuación, se muestra un esquema personalizado de DCAT US 1.1 con varias modificaciones, entre las que se incluyen las siguientes:

  • Agregar un par de clave/valor
  • Actualizar un par de clave/valor
  • Agregar una reserva para un par de clave/valor

Esquema DCAT US 1.1 personalizado

{
 "title": "{{name}}",
"description": "{{description}}",
	"keyword": "{{tags}}",
	"issued": "{{created:toISO}}",
	"modified": "{{modified:toISO}}",
	"publisher": {
		"name": "{{source}}"
	},
	"contactPoint": {
		"fn": "{{owner}}",
		"hasEmail": "{{orgContactEmail}}"
	},
	"culture": "{{culture}}",
	"summary": "{{snippet}}",
	"platform": "ArcGIS Hub",
	"bureauCode": [
		"010:86",
		"010:04"
	],
	"programCode": [
		"015:001",
		"015:002"
	]
}
Nota:

El esquema personalizado de DCAT US 1.1 incluye la adición de cinco nuevas claves: “culture”, “summary”, “platform”, “bureauCode” y “programCode”. Las claves “culture” y “summary” tienen valores de plantilla que extraen de la API de Hub V3, la última versión de la API de Hub. Las claves “platform”, “bureauCode” y “programCode” tienen valores literales de cadena de caracteres.

Ejemplos de valores personalizados

Para que coincidan con los estándares de metadatos de una organización, muchos administradores de sitios querrán ajustar los metadatos que aparecen en un feed. Una clave puede ser cualquier cadena de caracteres literal como “title” o “” pero, por lo general, deben ajustarse a un estándar de metadatos de destino. Los valores correspondientes pueden ser un literal de cadena de caracteres o una plantilla que extrae una clave de la API de Hub V3. Para las plantillas, puede proporcionar cualquier clave devuelta por la API V3, de nivel superior o anidada.

Por ejemplo, en el sitio de ejemplo de feeds de ArcGIS Hub en dc.esri.com, existe una capa pública titulada "Vigilancias y advertencias meteorológicas de EE. UU.". Puede ver los metadatos JSON de ese dataset accediendo al Id. de la capa: c7a223914778420db8bf000b4eb6ec6f con la API de Hub V3 (https://hub.arcgis.com/api/v3/datasets/c7a223914778420db8bf000b4eb6ec6f). Si el elemento tiene varias capas, agregue el número de capa al final del Id. de elemento (`<Id. de elemento>_<número de capa>`).

Al acceder a la respuesta de API de ejemplo anterior, debería ver una respuesta JSON empezando por lo siguiente:

Ejemplo de valor personalizado de DCAT US 1.1

"data": 
{
    "id": "c7a223914778420db8bf000b4eb6ec6f",
    "type": "dataset",
    "attributes": {
        "errors": [],
        "access": "public",
        "additionalResources": [],
  …
}

Si se desplaza hacia abajo, verá más claves entre las que elegir y utilizar como valores de plantilla en el editor, como "created", que representa la fecha en la que se creó el contenido. Para utilizar un valor de la API de Hub V3, en el editor de feed, agregue un valor de plantilla para cualquier clave API de Hub V3 debajo de “attributes”. Por ejemplo, si desea incluir "created" en los registros del feed, como los siguientes:

Ejemplo de valor personalizado de DCAT US 1.1

{
…
 	"bureauCode": ["010:86","010:04"],
 	"programCode": ["015:001","015:002"],
 	"created": 1610151009000,
…
}
En este mismo ejemplo, agregaría las siguientes líneas al esquema personalizado de DCAT US 1.1:
{
…
  "bureauCode": [
   "010:86",
   "010:04"
],
  "programCode": [
   "015:001",
   "015:002"
],
  "created": "{{item.created}}"
…
}

Los administradores de contenido pueden configurar un feed para que incluya más distribuciones personalizadas. Se unen a las distribuciones existentes, que Hub genera automáticamente para los recursos descargables de un elemento de contenido.

Federar catálogos a través de feeds de Hub

Los editores de feed de Hub permiten a los administradores de sitios estandarizar cómo describen sus datos. Los administradores de sitios pueden elegir qué valores de metadatos se muestran para cada dataset del feed antes de que se recopile.

Federar con Data.gov

En Estados Unidos, puede modificar la salida para que funcione específicamente con grandes catálogos de datos como el catálogo nacional de Data.gov. Este tipo de interoperabilidad significa que puede dirigir estos agregadores de terceros a los diversos formatos (distribuciones) en que está disponible un dataset. Las distribuciones son formatos ofrecidos para utilizarlos como un servicio web, una descarga o una API.

Los administradores de sitios pueden elegir qué atributos y valores se aplican al feed de salida de DCAT US 1.1 de un sitio. En el editor de feed, debe proporcionar claves válidas correspondientes a los metadatos de un dataset.

Federar con CKAN

Si su organización utiliza software de catálogo como CKAN o trabaja con otras organizaciones que lo hacen, puede federar el catálogo de datos de su sitio de Hub. Debe configurar correctamente la instancia de CKAN para que permita la recopilación de datos. En primer lugar, instale y configure dos extensiones desarrolladas y mantenidas por el equipo de CKAN y que utilizan Data.gov y otros para recopilar datasets: la extensión de recopilación de CKAN y la extensión DCAT de CKAN.

Después de confirmar que estas extensiones están instaladas, asegúrese de que los servicios Harvester Gather_Consumer y Fetch_Consumer se estén ejecutando como servicios en segundo plano. Consulte la documentación de CKAN para obtener más información.

Recopilar el catálogo de ArcGIS Hub

Para recopilar el catálogo, siga estos pasos:

  1. Vaya a la página de administración de la recopilación de CKAN e inicie sesión en http://yourCKANinstance/harvest.
  2. Seleccione la opción Add harvest source (Agregar un origen de recopilación) y proporcione información sobre su sitio de Hub:
    • Rellene la URL con http://yourOpenDataSite/data.json.
    • Asigne al origen de recopilación un título similar al título de su sitio.
    • Si lo desea, rellene el cuadro de descripción.
    • Seleccione DCAT JSON harvester (Recopilador JSON de DCAT) como tipo de origen.
    • Para la frecuencia de actualización, seleccione Manual.
    • Cuando haya finalizado, seleccione Save (Guardar).
  3. Seleccione Admin (Administrador) y seleccione Reharvest (Volver a recopilar).
  4. Ejecute los trabajos de recopilación en su instancia de CKAN.

    CKAN procesa su archivo data.json e incluye todos sus datasets. Puede ver lo que se recopila consultando el origen de recopilación. Todas las descripciones, etiquetas y distribuciones de datasets de Hub son accesibles desde la instancia de CKAN.

Nota:

Es posible que experimente algunos retrasos la primera vez que previsualiza un archivo .csv o .json a medida que Hub genera una caché de los datos y CKAN no puede identificar cómo gestionarlo mientras se procesan los datos. Esto no volverá a ocurrir la próxima vez que previsualice el archivo.