Vous pouvez utiliser les outils d’ingénierie des données pour nettoyer et préparer vos données. Un sous-ensemble d’outils de géotraitement est disponible dans la vue Data Engineering (Ingénierie des données) pour vous aider à préparer vos données avant de les utiliser dans une carte ou une analyse. Ces outils sont regroupés dans les catégories suivantes :
- Clean (Nettoyer) : permettent de nettoyer les données. Vous pouvez supprimer les champs inutiles, par exemple. Vous pouvez également modifier les champs ou remplir des valeurs manquantes.
- Construct (Construire) : permet de créer des champs qui découlent de champs existants ou des propriétés de la couche. Vous pouvez par exemple ajouter et calculer un nouveau champ, normaliser, transformer ou reclasser un champ existant et ajouter un champ en fonction de la géométrie de la couche en entrée.
- Integrate (Intégrer) : permet d’intégrer ou d’ajouter des données d’une autre source de données dans la classe d’entités ou table en entrée. Vous pouvez par exemple joindre des champs ou ajouter des champs en enrichissant les données.
- Format : permet de modifier le format des champs ou de réorganiser les champs dans la classe d’entités ou table. Vous pouvez par exemple convertir des champs temporels, coder des champs catégoriels ou réduire les dimensions des champs existants.
Remarque :
Certains outils de géotraitement dans la vue Data Engineering (Ingénierie des données) ne sont pas disponibles pour une couche non modifiable. Dans ce cas, créez une copie modifiable de la couche et ouvrez une nouvelle vue Data Engineering (Ingénierie des données).
Vous pouvez accéder à ces groupes et outils dans la vue Data Engineering (Ingénierie des données) en procédant de l’une des façons suivantes :
- Cliquez avec le bouton droit sur le menu contextuel d’un champ dans le volet des champs.
- Cliquez avec le bouton droit sur le menu contextuel d’un champ dans le volet des statistiques.
- Cliquez sur l’outil dans le ruban Data Engineering (Ingénierie des données).
Ruban Data Engineering (Ingénierie des données)
Lorsque la vue Data Engineering (Ingénierie des données) est active, un ruban contextuel apparaît en haut de l’application. Le ruban permet d’accéder aux commandes et outils utilisés pour explorer et préparer les données.
Le groupe Data (Données) du ruban permet d’accéder à la vue des champs et à la table attributaire de la couche associée à la vue Data Engineering (Ingénierie des données) active. Le groupe Tools (Outils) offre quatre bibliothèques d’outils : Clean (Nettoyer), Construct (Construire), Integrate (Intégrer) et Format. Chaque bibliothèque d’outils contient un sous-ensemble d’outils de géotraitement pour la tâche d’ingénierie des données respective. Par défaut, la couche associée à la vue Data Engineering (Ingénierie des données) permet de renseigner automatiquement le paramètre des entités en entrée de ces outils. Dans le groupe Spatial, Display XY Data (Afficher des données XY) et Geocode Table (Géocoder la table) convertissez vos tables autonomes non spatiales en données spatiales.
Outils Data Engineering (Ingénierie des données)
Les tables suivantes décrivent tous les outils du ruban Data Engineering (Ingénierie des données).
Remarque :
Certains des outils de géotraitement ne sont pas disponibles pour les données non spatiales, telles que les tables autonomes.
Nettoyer
Les outils suivants sont disponibles dans la catégorie Clean (Nettoyer) :
Outil | Description |
---|---|
Supprime un ou plusieurs champs d'une table, d'une classe d'entités, d'une couche d'entités ou d'un jeu de données raster. | |
Renomme les champs et alias de champ ou modifie les propriétés de champ. | |
Projette des données spatiales d'un système de coordonnées vers un autre. | |
Supprime tous les enregistrements ou le sous-ensemble sélectionné de la saisie. | |
Remplace les valeurs manquantes (nulles) par des valeurs estimées en fonction de voisins spatiaux, de voisins spatio-temporels, de valeurs chronologiques ou de valeurs statistiques globales. |
|
Identifie les points aberrants spatiaux globaux ou locaux dans des entités ponctuelles. |
Construire
Les outils suivants sont disponibles dans la catégorie Construct (Construire) :
Outil | Description |
---|---|
Calcule les valeurs d'un champ pour une classe d'entités, une couche d'entités ou un raster. | |
Ajoute un nouveau champ à une table ou la table d’une classe d’entités, couche d’entités et/ou de rasters avec des tables attributaires. |
|
Calculer des taux bruts ou lissés. La méthode globale du taux de Bayes empirique lisse les taux pour les rapprocher d’un taux de référence global. Les méthodes de taux de Bayes empirique local, de moyenne pondérée localement et de médiane pondérée localement utilisent les voisins locaux pour effectuer un lissage spatial du taux. | |
Ajoute des informations aux champs attributaires d’une entité représentant les caractéristiques spatiales ou géométriques ainsi que la localisation de chaque entité, telles que la longueur ou la surface, ainsi que les coordonnées x, y, z et les valeurs m. | |
Transforme des valeurs continues en un ou plusieurs champs en appliquant des fonctions mathématiques à chaque valeur et en modifiant la forme de la distribution. Les méthodes de transformation de l’outil sont les suivantes : logarithmique, racine carrée, Box-Cox, inverse multiplicatif, carré, exponentielle et Box-Cox inverse. | |
Standardise les valeurs des champs en les convertissant en valeurs conformes à une échelle spécifiée. Parmi les méthodes de standardisation figurent les suivantes : score z, minimum-maximum, maximum absolu et standardisation robuste. | |
Réduit le nombre de dimensions d’un ensemble de variables continues en agrégeant le maximum de variance possible dans moins de composantes via la méthode Analyse des composantes principales (ACP) ou Analyse discriminante linéaire à rang réduit (ADL). | |
Lisse les données des séries chronologiques, ce qui permet de tenir compte des fluctuations à court terme pour exposer les cycles et tendances à long terme. L’outil peut utiliser la variable numérique d’une ou de plusieurs séries chronologiques à l’aide de moyennes de déplacement centré, avant ou arrière, ainsi que d’une méthode adaptative basée sur une régression linéaire locale. |
Intégrer
Les outils suivants sont disponibles dans la catégorie Integrate (Intégrer) :
Outil | Description |
---|---|
Ajoute plusieurs jeux de données en entrée à un jeu de données cible existant, ou le met à jour le cas échéant. Les jeux de données en entrée peuvent être des classes d’entités, des tables, des shapefiles, des rasters, des classes d’entités annotations ou cotations. | |
Joint des attributs d’une entité vers une autre en fonction des relations spatiales. Les entités cible et les attributs joints des entités jointes sont écrits dans la classe d’entités en sortie. | |
Joint le contenu d'une table à une autre table en fonction d'un champ attributaire commun. La table en entrée est mise à jour pour contenir les champs de la table de jointure. Vous pouvez sélectionner quels champs de la table de jointure seront ajoutés à la table en entrée. | |
Calcule la distance et d’autres informations de proximité entre les entités en entrée et l’entité la plus proche dans une autre couche ou classe d’entités. | |
Superpose une couche surfacique avec une autre couche en vue de synthétiser le nombre de points, la longueur des lignes ou la surface des polygones dans chaque polygone, et calcule des statistiques des champs attributaires sur les entités dans les polygones. | |
Identifie les entités qui se trouvent à une certaine distance des entités dans la couche en entrée et calcule les statistiques des entités à proximité. | |
Crée une table ou une classe d’entités ponctuelles indiquant les valeurs des cellules d’un raster ou d’un jeu de rasters, pour des localisations définies. Les localisations sont définies par cellules de raster, points, polylignes ou polygones. | |
Enrichit les données en ajoutant des faits démographiques et paysagers sur les personnes et lieux qui entourent ou qui sont à l’intérieur des emplacements de données. La sortie est un doublon de votre entrée avec des champs attributaires supplémentaires. Cet outil requiert un compte d’organisation ArcGIS Online ou un jeu de données Business Analyst installé localement. |
|
Synthétise les attributs d’une couche surfacique en entrée en fonction de la superposition spatiale d’une couche surfacique cible et affecte les attributs synthétisés aux polygones cibles. Les polygones cibles comportent la somme des attributs numériques qui découlent des polygones en entrée sur lequel chacun se superpose. |
Format
Les outils suivants sont disponibles dans la catégorie Format :
Outil | Description |
---|---|
Transfère les valeurs temporelles stockées dans un champ dans un autre champ. L’outil permet la conversion entre des types de champ (texte, numérique ou date/heure) ou la conversion de valeurs dans un autre format, par exemple jj/MM/aa HH:mm:ss en aaaa-MM-jj. | |
Convertit des valeurs temporelles enregistrées dans un champ date d'un fuseau horaire vers un autre fuseau horaire. | |
Crée une table à partir de la table en entrée en réduisant la redondance dans les enregistrements et en mettant à plat les relations un vers plusieurs. | |
Fait basculer les données stockées dans des champs ou colonnes vers les lignes d'une nouvelle table ou classe d'entités. | |
Reclasse les valeurs d’un champ numérique ou de texte dans des classes en fonction de limites définies manuellement ou à l’aide d’une méthode de reclassification. | |
Convertit des valeurs de catégorie (chaîne, entier ou date) en plusieurs champs numériques représentant chacun une catégorie. Les champs numériques encodés peuvent être utilisés dans la plupart des processus de science des données et statistiques, y compris les modèles de régression. |
Remarque :
La plupart des opérations de géotraitement qui modifient les données en entrée ne peuvent pas être annulées.
Vous avez un commentaire à formuler concernant cette rubrique ?