Avec l’ingénierie des données, vous pouvez explorer, visualiser, nettoyer et préparer des données. L’ingénierie des données est une première étape courante pour de nombreux processus d’analyse spatiale et de cartographie. La vue et le ruban Data Engineering (Ingénierie des données) peuvent vous aider à mieux comprendre les données et à les préparer pour les processus SIG.
Vous pouvez réaliser les opérations suivantes dans la vue Data Engineering (Ingénierie des données) :
- Ouvrir une vue Data Engineering (Ingénierie des données) pour une ou plusieurs couches.
- Explorer les champs des données en consultant une liste de champs par type, puis en cartographiant les données et en créant des diagrammes rapidement pour en dégager des modèles.
- Interagir avec les statistiques des données pour mieux comprendre leurs valeurs et leur distribution.
- Préparer les données en appliquant des outils de géotraitement pour les nettoyer, les construire, les intégrer et les mettre en forme.
Commencer avec une présentation rapide de l’ingénierie des données
Exemple
Par exemple, vous disposez d’un jeu de données des niveaux d’éducation pour les comtés des États-Unis. Lorsque vous ouvrez la vue Data Engineering (Ingénierie des données) à l’aide de ce jeu de données, vous pouvez explorer et préparer les données. Le volet des champs affiche le nom ou l’alias de champ et le type, avec des boutons qui symbolisent et créent un diagramme d’un champ, ou vous pouvez accéder au champ dans la table attributaire. Dans le volet des statistiques, vous pouvez choisir un sous-ensemble de champs pour afficher les mesures de qualité des données, afficher les statistiques et afficher un aperçu des diagrammes. Vous pouvez filtrer les résultats par type de données pour les analyser davantage ou exporter les statistiques vers une table autonome.
Une fois l’examen des données effectué, vous pouvez utiliser les outils et fonctionnalités du ruban pour les préparer. Vous pouvez par exemple utiliser l’outil Transformer un champ de la bibliothèque Construct (Construire) pour normaliser les champs ou l’outil Remplacer les valeurs manquantes de la bibliothèque Clean (Nettoyer) pour remplacer les valeurs nulles. Il est également possible de cliquer avec le bouton droit de la souris sur la cellule contenant le nombre de valeurs nulles pour ouvrir l’outil Fill Missing Values (Remplacer les valeurs manquantes). Vous pouvez aussi utiliser les outils des menus contextuels dans les volets des champs et des statistiques de la vue Data Engineering (Ingénierie des données) pour résoudre les éventuels problèmes de données.
Vous avez un commentaire à formuler concernant cette rubrique ?