Skip To Content

Fédérer les données avec DCAT et d’autres catalogues externes

Le catalogue de données de votre site référence les données associées à votre site. Les données de site sont gérées dans le gestionnaire de groupes (Groups Manager) du site. Celui-ci permet d’ajouter des groupes de données à partir de ArcGIS Online ou d’utiliser JSON pour fédérer vos données avec des catalogues de données externes, tels que CKAN ou Data.gov.

Attention :

Avant de commencer à fédérer le catalogue d’un site, assurez-vous que les données que vous utilisez sont partagées avec un groupe pour lequel les capacités Open Data sont activées. Pour en savoir plus, consultez la rubrique Activer les capacités Open Data pour les groupes.

Fédérer avec CKAN

DCAT permet aux organisations de normaliser la contribution aux données et d’aider les personnes à analyser les sources gouvernementales. Si votre organisation recourt à d’autres logiciels tels que CKAN, vous pouvez utiliser le catalogue de données d’ArcGIS Hub pour configurer vos sites Hub avec DCAT. Ce type d’interopérabilité signifie que vous pouvez partager des jeux de données dans plusieurs formats (fichiers .shp, .kml et .csv) et API (Geoservices, WMS et GeoJSON) sur une plateforme CKAN.

Avant de commencer

Votre instance CKAN doit être configurée correctement pour assurer le moissonnage de données. En premier lieu, vous devez installer et configurer deux extensions qui sont développées et gérées par l’équipe CKAN et utilisées par Data.gov et d’autres pour moissonner des jeux de données : l’extension de moissonnage CKAN et l’extension CKAN DCAT .

Une fois ces extensions installées, assurez-vous que les services de moissonnage Gather_Consumer et Fetch_Consumer sont en cours d’exécution en arrière-plan.

  1. Activez votre environnement Python local : ./usr/lib/ckan/default/bin/activate
  2. Activez le processus Gather : paster --plugin=ckanext-harvest harvester gather_consumer --config='/path/to/your config.ini'
  3. Activez le processus Fetch : paster --plugin=ckanext-harvest harvester fetch_consumer --config='/path/to/your config.ini'

Moissonner le catalogue ArcGIS Hub

Pour moissonner le catalogue ArcGIS Hub, procédez comme suit :

  1. Accédez à votre page d’administration de moissonnage CKAN et connectez-vous sur http://yourCKANinstance/harvest.
  2. Sélectionnez l’option d’ajout de la source de moissonnage et fournissez les informations concernant votre site du Hub :
    • Renseignez l’URL avec http://yourOpenDataSite/data.json.
    • Attribuez un titre à la source de moissonnage qui ressemble au titre de votre site du Hub.
    • Renseignez éventuellement la zone de description.
    • Sélectionnez le type de source DCAT JSON Harvester (Moissonneur JSON DCAT).
    • Pour la fréquence de mise à jour, sélectionnez Manual (Manuel).
    • Cliquez sur Save (Enregister) lorsque vous avez terminé.
  3. Sélectionnez admin, puis Reharvest (Remoissonner).
  4. Exécutez les tâches de moissonnage sur votre instance CKAN.
  5. Activez votre environnement Python : ./usr/lib/ckan/default/bin/activate.
  6. Saisissez la commande : paster --plugin=ckanext-harvest harvester run --config='path/to/your config.ini'.

CKAN va maintenant traiter votre fichier data.json et inclure tous vos jeux de données. Pour voir ce qui est moissonné, affichez la source de moissonnage. Toutes vos descriptions, balises et distributions de jeux de données issues de ArcGIS Hub sont accessibles depuis de l’instance de CKAN.

Remarque :

Vous pouvez constater un comportement inattendu lorsque vous tentez de prévisualiser un fichier .csv ou .json pour la première fois. ArcGIS Hub génère un cache de ces données et CKAN ne peut pas identifier la façon de gérer ce cas lors du traitement des données. Ceci ne se reproduira pas lors de votre prochaine tentative de prévisualisation du fichier.

Fédérer avec Data.gov

Pour fédérer vos données en Open Data avec Data.gov, vous devez vous conformer à la norme Project Open Data (POD) standard v1.1, qui diffère légèrement de la norme DCAT par défaut fournie sur votre URL /data.json. Vous pouvez configurer votre flux data.json en ajoutant le code de bureau requis et le code de programme dans l’éditeur de configuration (Configuration Editor) DCAT.

Pour fédérer avec Data.gov, procédez comme suit :

  1. Accédez au site à intégrer.
  2. Cliquez sur le bouton de mise à jour pour ouvrir le site en mode de mise à jour.
  3. Cliquez pour ouvrir le menu déroulant du site dans la barre de navigation de mise à jour.
  4. Cliquez sur Content Library (Bibliothèque de contenu).
  5. Cliquez sur bouton More (Plus) en regard du bouton New (Nouveau).
  6. Cliquez sur Configure DCAT (Configurer DCAT).
  7. Dans l’éditeur de configuration (Configuration Editor) DCAT, copiez-collez le code suivant à n’importe quel emplacement après une virgule et avant la dernière parenthèse.

    Remarque :
    Les codes de bureau et de programme collés ici à ce stade seront appliqués à chaque jeu de données de votre flux data.json. Si vous avez besoin que des codes différents s’appliquent à différents jeux de données au sein de votre catalogue, contactez le centre de support technique Esri pour plus d’explications.

    • Pour un code de bureau et un code de programme :
      "bureauCode": [
            "010:86"
            ],
          "programCode": [
              "015:001"
            ],
    • Pour plus d’un code :
      "bureauCode": [      "010:86",      "010:04"
            ],    "programCode": [        "015:001",        "015:002"
            ],
    Astuce:

    Par exemple, un code de bureau et un code de programme doivent se présenter comme suit :

    {
                   "title": "{{default.name}}",               "description": "{{default.description}}",               "keyword": "{{item.tags}}",               "issued": "{{item.created:toISO}}",               "modified": "{{item.modified:toISO}}",               "publisher": {
                                  "source": "{{default.source.source}}"
                   },               "bureauCode": [                  "010:86"
                      ],                 "programCode": [                  "015:001"
                     ],               "contactPoint": {
                                  "fn": "{{item.owner}}",                              "hasEmail": "{{org.portalProperties.links.contactUs.url}}"
                    }
                  }

  8. Remplacez les codes de bureau et de programme par les codes de votre organisation. Pour plus d’informations sur le format du code de bureau et du code de programme, reportez-vous aux notes (en anglais) fournies sur Project Open Data en suivant leurs liens respectifs.
  9. Vérifiez que votre flux DCAT fonctionne en collant l’URL DCAT de votre site dans le validateur (Validator) de Project Open Data.
    Astuce:

    L’URL DCAT de votre site se trouve dans la page DCAT Configuration (Configuration DCAT) dans le texte indiqué sous l’onglet Editor (Éditeur).

  10. Lorsque vous êtes prêt à confirmer vos modifications, cliquez sur Save (Enregistrer) sous l’éditeur dans la page DCAT Configuration (Configuration DCAT).