Federare i dati con DCAT e altri cataloghi esterni

Il catalogo dati del sito si riferisce agli elementi aggiunti alla libreria dei contenuti del sito, inclusi gli elementi condivisi con i gruppi che sono stati aggiunti utilizzando Gestione gruppi del sito.

È possibile federare questo catalogo dati con cataloghi esterni, come CKAN, usando l'URL che viene automaticamente generato per ogni sito hub su www.yourhubsite.gov/data.json. È possibile anche modificare il contenuto del catalogo per sito usando l'editor di Configurazione DCAT in ArcGIS Hub. Negli Stati Uniti, è possibile modificare l'output per lavorare specificatamente con il catalogo nazionale Data.gov.

Attenzione:

Solo i dati condivisi pubblicamente popolano il catalogo data.json. I contenuti privati all'interno dell'organizzazione non possono attualmente essere condivisi o federati attraverso il metodo del catalogo DCAT.

Federa con CKAN

Il catalogo DCAT permette alle organizzazioni di standardizzare il modo in cui descrivono i contributi di dati che hanno per aiutare le persone a trovare i loro contenuti attraverso motori di ricerca e cataloghi di terze parti. Se la tua organizzazione usa un software di catalogazione come CKAN, o lavora con altre organizzazioni che lo fanno, puoi usare il catalogo dei dati ArcGIS Hub per configurare l'output DCAT automatico del tuo sito. Questo tipo di interoperabilità significa che puoi puntare questi aggregatori di terze parti a tutte le opzioni di formato di download multiplo dei tuoi dataset (.shp, .kml, e file .csv) e API (Geoservices, WMS e GeoJSON) su una piattaforma CKAN.

Prima di iniziare

È necessario configurare la propria istanza di CKAN in modo che supporti la raccolta dei dati. Innanzitutto, installare e configurare due estensioni sviluppate e mantenute dal team di CKAN e utilizzate da Data.gov e altri per la raccolta di dataset: l'estensione per la raccolta CKAN e l'estensione DCAT di CKAN.

Dopo aver verificato che queste estensioni siano installate, assicurarsi che i servizi Harvester Gather_Consumer e Fetch_Consumer siano in esecuzione in background.

  1. Attivare l'ambiente Python locale: ./usr/lib/ckan/default/bin/activate
  2. Attivare il processo Raccolta: paster --plugin=ckanext-harvest harvester gather_consumer --config='/path/to/your config.ini'
  3. Attivare il processo Recupero: paster --plugin=ckanext-harvest harvester fetch_consumer --config='/path/to/your config.ini'

Raccolta dei dati del catalogo ArcGIS Hub

Per raccogliere il catalogo ArcGIS Hub, attenersi alla seguente procedura:

  1. Andare alla pagina di amministrazione del servizio di raccolta CKAN e accedere su http://yourCKANinstance/harvest.
  2. Selezionare il comando di aggiunta dell'origine della raccolta e fornire alcune informazioni sul proprio sito Hub:
    • Completare l'URL con http://yourOpenDataSite/data.json
    • Denominare l'origine della raccolta con un titolo simile a quello del sito.
    • Facoltativamente, compilare la casella della descrizione.
    • Selezionare DCAT JSON Harvester come tipo di origine.
    • Per la frequenza di aggiornamento selezionare manuale.
    • Al termine, fare clic su Salva.
  3. Selezionare admin, quindi Raccogli ancora.
  4. Eseguire i processi di raccolta dei dati sulla propria istanza di CKAN.
  5. Attivare il proprio ambiente Python: ./usr/lib/ckan/default/bin/activate.
  6. Immettere il comando: paster --plugin=ckanext-harvest harvester run --config='path/to/your config.ini'.

    I processi CKAN del file data.json e include tutti i dataset. Per monitorare cosa viene raccolto, visualizzare l'origine della raccolta dei dati. Tutte le descrizioni, i tag e le distribuzioni di dataset da ArcGIS Hub sono accessibili dall'instanza CKAN.

Nota:

È possibile fare esperienza dei ritardi la prima volta che si visualizza l'anteprima di un file .csv o .json perchè ArcGIS Hub genera una cache dei dati e CKAN non può identificare come gestire questo mentre i dati sono in elaborazione. Questo non si verificherà la prossima volta che si visualizza l'anteprima del file.

Federa con Data.gov

Per federare gli open data con Data.gov, è necessario rispettare lo standard Project Open Data (POD) v1.1, che differisce leggermente dallo standard DCAT predefinito fornito nell'URL di /data.json. È possibile configurare il feed data.json aggiungendo il codice bureau e il codice programma richiesti nell'Editor di configurazione di DCAT.

Per federare con Data.gov, completare i passaggi seguenti:

  1. Nella nuova finestra di browser, aprire il sito che si desidera integrare.
  2. Cliccare il pulsante di modifica modifica per aprire il sito nella modalità di modifica.
  3. Fare clic per aprire il menu a discesa del sito nella barra di navigazione delle modifiche.
  4. Fare clic su Libreria dei contenuti.
  5. Cliccare il pulsante altro altro e scegliere Configura DCAT.
  6. Nell'editor Configurazione DCAT, copiare e incollare il seguente codice ovunque dopo una virgola e prima dell'ultima parentesi.

    Nota:
    I codici bureau e programma incollati qui sono applicati a ciascun dataset nel feed di data.json. Se sono necessari codici differenti da applicare a dataset differenti nel catalogo, contattare Supporto Tecnico di Esri per l'assistenza.

    • Per un solo codice bureau e un solo codice programma, usare le operazioni seguenti:
      "bureauCode": [
            "010:86"
            ],
          "programCode": [
              "015:001"
            ],
    • Per più di un codice, usate il seguente:
      "bureauCode": [
            "010:86",
            "010:04"
            ],
          "programCode": [
              "015:001",
              "015:002"
            ],
    Suggerimento:

    Ad esempio, un codice bureau e un codice programma possono essere formattati come di seguito:

    {
                   "title": "{{default.name}}",
                   "description": "{{default.description}}",
                   "keyword": "{{item.tags}}",
                   "issued": "{{item.created:toISO}}",
                   "modified": "{{item.modified:toISO}}",
                   "publisher": {
                                  "source": "{{default.source.source}}"
                   },
                   "bureauCode": [
                      "010:86"
                      ],
                     "programCode": [
                      "015:001"
                     ],
                   "contactPoint": {
                                  "fn": "{{item.owner}}",
                                  "hasEmail": "{{org.portalProperties.links.contactUs.url}}"
                    }
                  }

  7. Sostituire il codice bureau e il codice programma con il codice corretto per l'organizzazione. Per maggiori informazioni sulla formattazione del codice bureau e codice programma, consultare le note fornite sul sito Project Open Data seguendo i collegamenti rispettivi .
  8. Verificare che il feed DCAT sta lavorando incollando l'URL del sito DCAT in Project Open Data Validator.
  9. Cliccare Salva sotto l'editor sulla pagina Configurazione DCAT quando si è pronti per confermare le modifiche.