En quoi consiste une connexion d’entités multi-fichier ?

Une connexion d'entités multi-fichier (MFC) permet de connecter rapidement des sources de données pour visualiser et analyser des jeux de données volumineux. Une MFC fournit les fonctionnalités et la flexibilité nécessaires à l’utilisation de vos données et à leur mise en forme.

Elle fait référence à un dossier d’un ou de plusieurs jeux de données. Les jeux de données dans une connexion d’entités multi-fichier sont utilisés en tant que données d’entités en entrée (points, polylignes, polygones et données tabulaires) pour les outils de géotraitement. Lorsque vous créez une connexion d’entités multi-fichier, un fichier .mfc est créé. Ce fichier pointe vers un répertoire de jeux de données qui indique les jeux de données et leur structure dans la connexion d’entités multi-fichier, notamment la géométrie et des informations temporelles. Vous pouvez parcourir les jeux de données MFC à l’aide des outils de géotraitement et les afficher sur la carte. Voici quelques exemples d’utilisation appropriée d’une connexion d’entités multi-fichier :

  • Vous avez plusieurs shapefiles représentant une zone de grande envergure. Chaque shapefile représente un sous-ensemble de la zone et vous voulez utiliser tous les shapefiles ensemble.
  • Vous recevez un nouveau fichier .csv tous les jours avec des relevés de température. Vous voulez inclure le nouveau fichier .csv dans le cadre d’un jeu de données avec vos fichiers .csv existants.
  • Vous utilisez des données qui comportent plusieurs champs représentant l’heure d’un événement. Vous voulez utiliser tous les champs pour représenter l’heure.
  • Vous avez des fichiers Parquet à utiliser.

Voici les raisons pour lesquelles utiliser une connexion d’entités multi-fichier en entrée dans les outils de géotraitement :

  • Vous pouvez représenter plusieurs jeux de données de même structure et de même type de fichier en tant que jeu de données unique.
  • Une connexion d’entités multi-fichier accède aux données pendant l’analyse, si bien que vous pouvez continuer à ajouter des données à un jeu de données existant sans devoir réinscrire ou publier vos données.
  • Vous pouvez modifier la connexion d’entités multi-fichier de façon à supprimer, ajouter ou mettre à jour les jeux de données visibles.
  • Les MFC permettent de définir facilement l’heure et la géométrie et acceptent plusieurs formats horaires dans un jeu de données unique.

Formats de données pris en charge

Les connexions d’entités multi-fichier prennent en charge les jeux de données suivants :

  • Fichiers délimités (tels que .csv, .tsv et .txt)
  • Shapefiles (.shp)
  • Fichiers Parquet (.parquet)
    Remarque :

    Seuls les fichiers Parquet non chiffrés sont pris en charge.

  • Fichiers ORC (.orc)

Si vous utilisez une connexion d’entités multi-fichier dans les outils GeoAnalytics Desktop, tous les formats en entrée sont pris en charge. Si vous utilisez des jeux de données MFC dans un autre outil de géotraitement, seuls les shapefiles et les fichiers délimités sont pris en charge.

En savoir plus sur l’analyse avec des fichiers MFC

Terminologie des connexions d’entités multi-fichier

La table suivante répertorie les termes couramment utilisés avec les connexions d’entités multi-fichier (MFC) :

TermeDescription

Connexion d’entités multi-fichier

Élément représentant le fichier MFC. Cette connexion d’entités multi-fichier (MFC) peut être développée de façon à afficher des jeux de données et explorée pour l’utiliser dans les outils de géotraitement. Ce fichier de connexion est l’interface AllSource de votre fichier MFC.

Fichier de connexion d’entités multi-fichier

Fichier (.mfc) qui est créé et stocké lorsque vous créez une connexion d’entités multi-fichier avec l’outil Créer une connexion d’entités multi-fichier. Le fichier contient des informations sur les jeux de données et les structures contenues, ainsi que des propriétés géométriques et temporelles. Lorsque vous affichez ce fichier dans AllSource, il s’agit d’un élément MFC.

En savoir plus sur les fichiers de connexion d'entités multi-fichier

Jeu de données MFC (connexion d’entités multi-fichier)

Jeu de données dans votre MFC. Vous pouvez ajouter ce jeu de données dans une carte ou l’utiliser en entrée dans des outils de géotraitement.

Localisation source

Localisation de dossier inscrite en tant que connexion d’entités multi-fichier (MFC). Cette localisation contient un ou plusieurs dossiers représentant les jeux de données MFC. Les outils de connexion d’entités multi-fichier ne modifient pas ce dossier.

Données source

Jeux de données inscrits dans la connexion d’entités multi-fichier. Lorsque vous utilisez une connexion d’entités multi-fichier, les données source ne sont pas modifiées. Les outils de connexion d’entités multi-fichier ne modifient pas ces données.

Structurer vos données en entrée

Pour utiliser vos jeux de données en entrée dans une connexion d’entités multi-fichier, les données doivent être structurées correctement. Pour préparer vos données à une connexion d’entités multi-fichier, formatez vos jeux de données dans des sous-dossiers, sous le dossier source unique que vous inscrivez. Dans ce dossier source, les noms des sous-dossiers représentent les noms des jeux de données.

Un dossier source avec trois sous-dossiers de jeux de données
Un dossier source qui contient trois sous-dossiers, chacun représentant un jeu de données, est affiché.

L’image ci-dessous représente la structure appropriée d’une connexion d’entités multi-fichier. Le dossier source est inscrit, et chaque sous-dossier dans le dossier source représente un jeu de données. Dans cet exemple, vous inscrivez le dossier source, et trois jeux de données sont inclus dans la connexion d’entités multi-fichier : Dataset-1, Dataset-2 et Dataset-3.

Dans les sous-dossiers, vous pouvez structurer vos données comme vous le souhaitez. Si vos sous-dossiers contiennent plusieurs dossiers ou fichiers, l’ensemble du contenu des sous-dossiers est lu en tant que jeu de données unique. Ils doivent en outre partager la même structure et le même type de fichier.

Remarque :

Tous les fichiers d’un dossier de jeux de données ont la même structure. Si un fichier a une structure différente, il ne sera pas utilisé correctement durant la visualisation et l’analyse.

L’image suivante illustre trois jeux de données avec différentes structures et un contenu de fichier différent :

Exemple de dossier source et de son contenu
Exemples d’inscriptions avec un dossier source, trois dossiers de jeux de données et leur contenu.

Dans cet exemple, trois dossiers de jeux de données identiques ont un contenu différent. Chaque jeu de données est décrit ci-dessous :

  • Dataset-1 : ce jeu de données se compose d’un seul fichier : D1-1. Lorsque Dataset-1 est utilisé dans le cadre d’une visualisation ou d’une analyse, un seul shapefile est utilisé.
  • Dataset-2 : ce jeu de données se compose de deux fichiers texte : D2-1 et D2-2. Lorsque Dataset-2 est utilisé dans le cadre d’une visualisation ou d’une analyse, les deux fichiers sont utilisés.
  • Dataset-3 : ce jeu de données se compose de deux dossiers : D3-Folder-1 et D3-Folder-2, chacun contenant un seul jeu de données, D3-1 et D3-2. Lorsque Dataset-3 est utilisé dans le cadre d’une visualisation ou d’une analyse, D3-1 et D3-2 sont tous les deux utilisés.

Ce sont des exemples de la manière dont vous pouvez structurer vos données. Le nombre de fichiers ou dossiers ne change pas la façon dont les données sont utilisées pour la visualisation ou l’analyse. Il n’y a aucun avantage à ajouter un sous-dossier ou à supprimer des sous-dossiers dans chaque dossier de jeux de données ; la structuration des dossiers à ce niveau est facultative.

Pour commencer à utiliser des connexions d’entités multi-fichier, reportez-vous à la rubrique Utiliser des connexions d’entités multi-fichier.