Skip To Content

Didacticiel : créer un pipeline de données

Apprenez à créer un processus pour préparer et intégrer des données issues de différentes sources en un jeu de données qui est mis à disposition dans votre environnement SIG.

Ouvrir l’application ArcGIS Data Pipelines et créer un pipeline de données

Pour ouvrir l’application Data Pipelines et commencer à créer un pipeline de données, procédez comme suit :

  1. Connectez-vous avec un compte ArcGIS et accédez à l’application Data Pipelines à l’aide du lanceur d’applications.

    La page de la bibliothèque Data Pipelines apparaît.

  2. Cliquez sur Create data pipeline (Créer un pipeline de données).

    L’éditeur de pipeline de données s’ouvre.

Ajouter une source de données

Une source de données charge les données dans le pipeline de données en vue de leur préparation. Pour ajouter une source de données au diagramme, procédez comme suit :

  1. Cliquez sur Inputs (Entrées) dans la barre d’outils Éditeur.

    Le volet Inputs (Entrées) apparaît.

  2. Cliquez sur Fichier.

    L’onglet modal Select a file (Sélectionner un fichier) apparaît.

  3. Cliquez sur Next (Suivant).

    Le navigateur d’éléments s’ouvre.

  4. Dans le navigateur d’éléments, sélectionnez ArcGIS Online dans la liste à côté de la barre de recherche.
  5. Recherchez Coastal Ferry Routes - Créer votre premier pipeline de données, puis cliquez sur l’élément correspondant et sur Add (Ajouter).

    Vous revenez dans le volet File (Fichier) et le paramètre Format est défini sur GeoJSON pour le jeu de données.

  6. Cliquez sur Preview (Aperçu).

    L’aperçu est chargé.

  7. Explorez le jeu de données en entrées de l’une des manières suivantes :
    • Cliquez sur l’onglet Table preview (Aperçu de la table) pour consulter une représentation tabulaire du jeu de données.
    • Cliquez sur l’onglet Map preview (Aperçu de la carte) pour consulter les localisations du jeu de données sur une carte. Dans l’aperçu de la carte, vous pouvez zoomer, vous déplacer et inspecter des attributs.
    • Cliquez sur l’onglet Schema (Structure) pour vérifier la structure du jeu de données.
    • Cliquez sur l’onglet Messages pour examiner les messages renvoyés par l’action d’aperçu.

Préparer les données

Data Pipelines inclut des outils capables de nettoyer et transformer des données. Parmi ces outils, citons l’outil Filtrer par attribut qui permet de sélectionner les itinéraires les plus empruntés et l’outil Sélectionner des champs qui permet de conserver les champs spécifiés dans la sortie finale.

Pour préparer les données à l’aide des outils Filtrer par attribut et Sélectionner des champs, procédez comme suit :

  1. Cliquez sur le bouton de fermeture qui se trouve en haut de la fenêtre d’aperçu.
  2. Cliquez sur Tools (Outils) dans la barre d’outils Éditeur, puis cliquez sur Filter by attribute (Filtrer par attribut).

    L’élément Filter by attribute (Filtrer par attribut) est ajouté au canevas.

  3. Configurez Filter by attribute (Filtrer par attribut) pour utiliser le jeu de données du fichier en entrée en procédant de l’une des manières suivantes :
    • Faites glisser le pointeur à partir du port en sortie de l’élément File (Fichier)au port en entrée de l’élément Filter by attribute (Filtrer par attribut).
    • Dans le volet Filter by attribute (Filtrer par attribut) panel, choisissez le jeu de données du fichier en utilisant le paramètre Input dataset (Jeu de données en entrée).
  4. Cliquez sur le bouton Build new query (Créer une nouvelle requête) dans le volet de l’outil.

    La boîte de dialogue Query builder (Générateur de requêtes) s’ouvre.

  5. Cliquez sur Expression, puis sur Next (Suivant).
  6. Dans le sélecteur de champs, sélectionnez FREQUENCY_OF_USE_IND. Saisissez une valeur High (Élevée) dans la zone de texte.
  7. Cliquez sur Add (Ajouter) dans la boîte de dialogue Query builder (Générateur de requêtes).
  8. Cliquez sur le bouton Tools (Outils) dans la barre d’outils Éditeur et cliquez sur Select fields (Sélectionner des champs).

    L’élément Select fields (Sélectionner des champs) est ajouté au canevas.

  9. Connectez le port en sortie de l’élément Filter by attribute (Filtrer par attribut) au port en entrée de l’élément Select fields (Sélectionner des champs) en utilisant l’une des options de l’étape 3 ci-dessus.
  10. Dans le volet Select fields (Sélectionner des champs), cliquez sur le bouton +Field (+Champ) et choisissez geometry (géométrie), FERRY_ROUTE_ID, ROUTE_NAME et MANIFEST_TYPE. Cliquez sur Done (Terminé) pour enregistrer la sélection des champs.

    Vous pouvez utiliser la zone de texte de recherche pour trouver rapidement les champs.

  11. Cliquez sur Preview (Aperçu) et examinez le résultat obtenu.

Exporter les données dans ArcGIS Online

Le jeu de données en entrée Coastal Ferry Routes a été filtré pour ne contenir que les itinéraires dont la fréquence d’utilisation est importante et une sélection de champs qui comportent des informations présentant un intérêt. Pour exporter ce jeu de données dans une couche d’entités dans ArcGIS Online, procédez comme suit :

  1. Cliquez sur Outputs (Sorties) dans la barre d’outils Éditeur, puis sur Feature layer (Couche d’entités).

    L’élément Feature layer (Couche d’entités) est ajouté au canevas.

  2. Connectez le port en sortie de l’élément Select fields (Sélectionner des champs) au port en entrée de l’élément Feature layer (Couche d’entités).
  3. Assurez-vous que le champ Geometry (Géométrie) est renseigné avec la valeur geometry.
  4. Pour Output name (Nom en sortie), indiquez un titre unique à attribuer à la couche d’entités en sortie.
  5. Dans la barre d’actions située en haut du canevas, cliquez sur Run (Exécuter).

    Le pipeline de données s’exécute alors et la console Latest run details (Détails de la dernière exécution) apparaît. À la fin du traitement, la couche d’entités est visible sous l’onglet Results (Résultats).

  6. Vous pouvez également cliquer sur la couche d’entités pour ouvrir la page de ses éléments dans ArcGIS Online.