Remarque :
L’ingénierie des données est disponible dans Insights desktop. Tous les utilisateurs de Insights in ArcGIS Online et Insights in ArcGIS Enterprise ont accès à Insights desktopInsights desktop. Pour plus d’informations, reportez-vous à la rubrique Présentation de ArcGIS Insights
L’ingénierie des données existe actuellement en mode Aperçu.
Les outils de colonne servent à apporter des modifications aux données d’une colonne spécifique et sont accessibles dans chaque colonne des tables, sous le modèle de données. Une fois appliqués, les outils de colonne sont ajoutés au modèle de données.
Convertir le type de données
Les types de données sont appliqués à chaque colonne dans Insights. Selon la mise en forme des données en entrée, le type de données par défaut peut ne pas être correct pour toutes les colonnes. Par exemple, les fichiers .csv ne prenant pas en charge le format date/heure, les colonnes de date/heure sont importées en tant que chaînes.
Les colonnes peuvent être converties en type de données chaîne, entier, double ou date/heure à l’aide de l’outil Convertir le type de données.
Pour convertir le type de données, procédez comme suit :
- Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
- Cliquez sur la flèche en regard du nom d’une colonne pour en développer le menu d’outils.
Remarque :
Si la vue est un modèle ou une carte, cliquez sur le bouton Show table (Afficher la table) .
- Choisissez Convert data type (Convertir le type de données) :
- Pour Output data type (Type de données en sortie), choisissez le type de données dans lequel vous voulez convertir la colonne et appliquez les options de mise en forme nécessaires :
- Pour convertir une colonne en date/heure, saisissez le format de date/heure.
- Pour convertir une colonne en type de données entier ou double, sélectionnez le type de séparateur décimal utilisé dans les données (Point ou Comma [Virgule]).
- Cliquez sur Apply (Appliquer).
La colonne est convertie dans le type de données sélectionné.
Entier
Les types de données Entier sont des nombres sans décimale.
Toute colonne avec des nombres peut être convertie en entier. Si la colonne contient des caractères qui ne sont pas des nombres, ils sont supprimés.
Si la colonne contient des valeurs décimales, celles-ci sont supprimées, sans que le nombre soit arrondi. Pour arrondir un nombre, vous pouvez convertir la colonne en type de données double, puis calculer une nouvelle colonne à l’aide de la fonction ROUND().
Les données de type Entier sont lues comme des champs numériques dans les classeurs Insights.
Double
Les données de type Double (ou à virgule flottante à double précision) sont des nombres acceptant les valeurs décimales.
Toute colonne avec des nombres peut être convertie en double. Si la colonne contient des caractères qui ne sont pas des nombres, ils sont supprimés.
Les données de type Double sont lues comme des champs numériques dans les classeurs Insights.
Date/heure
Les colonnes de date/heure peuvent être des dates uniquement, des heures uniquement ou une date et une heure.
Un format de date/heure est requis pour convertir une colonne en de type date/heure. Le format de date/heure par défaut est ISO 8601. Si les données ne sont pas au format ISO 8601, vous devez modifier le format dans la zone Custom format (Format personnalisé) et sélectionner celui qui correspond aux données.
Remarque :
Toutes les dates et heures d'une même colonne doivent utiliser le même format. Une bonne pratique consiste à inclure un composant de période pour toutes les valeurs d’heure selon une horloge de 12 heures pour garantir l’exactitude de l’heure utilisée.
Les variables suivantes sont prises en charge pour créer le format de date/heure :
Composant de date/heure | Variable | Valeurs prises en charge |
---|---|---|
Mois | MM | 01 à 12 |
V | 1 à 12 | |
Jour | DD | 01 à 31 |
D | 1 à 31 | |
Année | AAAA | Année à quatre chiffres |
AA | Année à deux chiffres (00 à 99) | |
Heure | HH | 00 à 24 |
H | 0 à 24 | |
hh | 01 à 12 | |
h | 1 à 12 | |
Minute | mm | 00 à 59 |
m | 0 à 59 | |
Seconde | ss | 00 à 59 |
s | 0 à 59 | |
Période | A | AM, PM ou le format de période pris en charge dans vos paramètres régionaux. |
a | ||
Fuseau horaire | ZZ | +HHmm or -HHmm |
TZD | +hh:mm ou -hh:mm |
Filtrer les valeurs
Les filtres attributaires utilisent des requêtes pour supprimer les données non nécessaires d’un jeu de données. Vous pouvez utiliser l’outil Filtrer les valeurs pour réduire la taille du jeu de données et inclure uniquement les données pertinentes pour l’analyse. Par exemple, vous pouvez supprimer les entrées avec des valeurs nulles ou filtrer les données selon une zone d’étude spécifique ou une plage de dates.
Procédez comme suit pour filtrer par valeurs :
- Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
- Cliquez sur la flèche en regard du nom d’une colonne pour en développer le menu d’outils.
Remarque :
Si la vue est un modèle ou une carte, cliquez sur le bouton Show table (Afficher la table) .
- Choisissez Filter values (Filtrer les valeurs).
- Pour filtrer les colonnes, procédez de l’une des manières suivantes :
- Dans le cas de colonnes de type chaîne, sélectionnez ou désélectionnez les valeurs uniques que vous voulez afficher ou exclure.
- Dans le cas de colonnes de type nombre ou taux/ratio, ajustez le curseur aux extrémités inférieure et supérieure de la plage, ou cliquez sur les nœuds et saisissez une nouvelle valeur.
- Dans le cas de colonnes de type date/heure, utilisez les boutons de calendrier et d’horloge pour ajuster respectivement les dates et heures de début et de fin. Vous pouvez également saisir directement une date ou une heure dans le filtre.
Pour plus d’informations sur l’application des paramètres de filtre pour chaque type de données, reportez-vous à la rubrique Filtrer les données.
- Cliquez sur Apply (Appliquer).
Le filtre est appliqué et les lignes qui ne correspondent pas aux critères sont supprimées.
Rechercher et remplacer
Remarque :
L’outil Rechercher et remplacer est actuellement disponible pour les colonnes de type chaîne. Pour remplacer les valeurs dans les colonnes de nombre et de date/heure, vous devez convertir la colonne en chaîne, remplacer la chaîne puis reconvertir la colonne dans son type de données initial.
L’outil Rechercher et remplacer permet de rechercher des valeurs spécifiques dans la colonne et de les remplacer par une nouvelle valeur. Cet outil peut, par exemple, remplacer des espaces réservés ou des valeurs par défaut par des valeurs nulles, corriger des fautes d’orthographe dans des chaînes, ou créer des casses cohérentes.
Pour utiliser l’outil Rechercher et remplacer, procédez comme suit :
- Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
- Cliquez sur la flèche en regard du nom d’une colonne pour en développer le menu d’outils.
Remarque :
Si la vue est un modèle ou une carte, cliquez sur le bouton Show table (Afficher la table) .
- Choisissez Find and replace (Rechercher et remplacer).
- Pour rechercher et de remplacer des valeurs, procédez de l’une des manières suivantes :
- Dans le cas de chaînes, restez sur l’onglet String (Chaîne) (par défaut), et dans la zone de texte Find (Rechercher), saisissez une chaîne personnalisée à rechercher dans la colonne. Vous pouvez également sélectionner Match Cases (Respecter la casse) pour que la recherche tienne compte de la casse, puis sélectionnez Match whole word only (Mot entier uniquement) pour ne renvoyer que les correspondances de la totalité de la chaîne.
- Dans le cas de valeurs de chaînes vides, cliquez sur l’onglet Empty string (Chaîne vide).
- Dans le cas de valeurs nulles, cliquez sur l’onglet Null.
- Spécifiez la valeur de remplacement en procédant de l’une des manières suivantes :
- Dans la zone de texte Replace with (Remplacer par), saisissez la chaîne qui doit remplacer les chaînes trouvées par la recherche.
- La zone Replace with (Remplacer par) doit être laissée vide si vous voulez que les chaînes renvoyées par la recherche soient remplacées par des chaînes vides.
- Pour remplacer des chaînes vides par des valeurs nulles (onglet Empty string [Chaîne vide]), sélectionnez Replace with null (Remplacer par la valeur Null).
- (Facultatif) Cliquez sur Find (Rechercher) pour rechercher et mettre en évidence les chaînes trouvées.
- Cliquez sur Replace (Remplacer) pour rechercher et remplacer les chaînes trouvées par la recherche.
- Répétez les étapes ci-dessus pour rechercher et remplacer d’autres chaînes, ou cliquez sur Done (Terminé) pour fermer la boîte de dialogue.
Les chaînes renvoyées sont mises à jour.
Supprimer une colonne
Utilisez l’outil Supprimer la colonne pour exclure les colonnes inutiles du jeu de données en sortie. Une colonne supprimée ne peut pas être affichée ultérieurement pendant l’analyse à l'aide de l’option Shown hidden fields (Afficher les champs masqués). La suppression d'une colonne n'intervient que dans le jeu de données en sortie et n'affecte pas le jeu de données source, où la colonne est conservée.
Remarque :
Les jeux de données dans les classeurs de données doivent posséder au moins une colonne. L’outil Supprimer la colonne est désactivé pour les jeux de données ne comportant qu’une seule colonne.
Pour supprimer une colonne du jeu de données, procédez comme suit :
- Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
- Cliquez sur la flèche en regard du nom d’une colonne pour en développer le menu d’outils.
Remarque :
Si la vue est un modèle ou une carte, cliquez sur le bouton Show table (Afficher la table) .
- Choisissez Remove column (Supprimer une colonne).
La colonne est supprimée de la table.
Afficher le résumé de la colonne
L’outil Afficher le résumé de la colonne crée un diagramme de distribution et calcule des statistiques à l’aide des données de la colonne. Le résumé permet ensuite de rechercher des problèmes dans les données (fautes d’orthographe, points aberrants, etc.).
Remarque :
L’outil Afficher le résumé de la colonne crée une visualisation des valeurs dans une colonne au lieu de modifier les valeurs. L’outil Afficher le résumé de la colonne n’est pas ajouté au modèle de données.
Pour créer un résumé de colonne, procédez comme suit :
- Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
- Cliquez sur la flèche en regard du nom d’une colonne pour en développer le menu d’outils.
Remarque :
Si la vue est un modèle ou une carte, cliquez sur le bouton Show table (Afficher la table) .
- Cliquez sur Show column summary (Afficher le résumé de la colonne).
Un volet latéral s'affiche, avec un diagramme et des statistiques pour la colonne.
Colonnes de chaîne
Les colonnes de chaîne créent un résumé sous forme de diagramme à barres. Le diagramme à barres affiche les valeurs uniques de la colonne avec le nombre d’entités tandis que le résumé affiche les statistiques pour le nombre total d’entités, le nombre de valeurs nulles, le nombre de chaînes vides et le nombre total de valeurs uniques. Vous pouvez utiliser le curseur sur le côté du diagramme pour effectuer un zoom avant sur toutes les valeurs uniques. Cliquez sur le bouton Sort (Trier) pour trier le diagramme dans l’ordre croissant, l’ordre décroissant ou l’ordre alphabétique.
Pour effectuer des sélections sur le résumé du diagramme à barres, cliquez sur chaque barre. Les sélections sur le résumé de la colonne sont reflétées dans la vue tabulaire ou la vue cartographique, le cas échéant.
Voici quelques problèmes que vous êtes susceptible de rencontrer dans le résumé d’une colonne de type chaîne :
- Est-ce que la colonne contient des valeurs nulles ou des chaînes vides ? Les valeurs nulles et les chaînes vides seront analysées séparément. Utilisez l'outil Find and replace (Rechercher et remplacer) pour remplacer des valeurs nulles par des chaînes vides et inversement.
- Toutes les valeurs utilisent-elles une casse cohérente ? Une incohérence de casse peut entraîner la séparation incorrecte de valeurs qui devraient être agrégées en une seule valeur unique. Utilisez l’outil Rechercher et remplacer pour rechercher une chaîne en ne respectant la casse et remplacer toutes les valeurs trouvées par une seule valeur.
- La colonne contient-elle des fautes d'orthographe ? Les fautes d'orthographe peuvent entraîner des agrégations inadéquates. Utilisez l'outil Find and replace (Rechercher et remplacer) pour rechercher la faute et la remplacer par la valeur correctement orthographiée.
Colonnes de nombre
Les colonnes de nombre créent un résumé sous forme d'histogramme. L’histogramme agrège les nombres dans des classes et affiche la fréquence des valeurs au sein de chaque classe. Les valeurs moyenne et médiane sont affichées dans l’histogramme et le résumé affiche les statistiques pour le nombre total d’entités, le nombre de valeurs nulles, la moyenne, la médiane approximative, les quartiles supérieur et inférieur, l’écart type, l’inclinaison et le coefficient d’aplatissement. Utilisez le curseur sous l'axe x pour changer le nombre de classes dans l'histogramme.
Pour effectuer des sélections sur le résumé de l’histogramme, cliquez sur chaque barre. Les sélections sur le résumé de l’histogramme sont reflétées dans la vue tabulaire ou la vue cartographique, le cas échéant.
Voici quelques problèmes que vous êtes susceptible de rencontrer dans le résumé d’une colonne de type nombre :
- Le jeu de données contient-il des points aberrants ou des valeurs en dehors de la plage attendue ? Par exemple, si la colonne comprend des valeurs de pourcentage, la plage attendue va de 0 à 100. Utilisez l'outil Filter values (Filtrer les valeurs) pour supprimer les lignes contenant des valeurs incorrectes.
- Les données sont-elles distribuées normalement ? Certaines analyses statistiques, comme Créer un modèle de régression, exigent que les données soient réparties normalement. Utilisez l'outil Calculate column (Calculer la colonne) pour appliquer une transformation à la colonne.
- Le jeu de données contient-il des espaces réservés ou des valeurs par défaut qui doivent être supprimés (9999, par exemple) ? Utilisez l’outil Rechercher et remplacer pour remplacer les valeurs par des valeurs nulles s’il y a lieu, ou utilisez l’outil Filtrer les valeurs pour supprimer les lignes contenant les espaces réservés ou les valeurs par défaut.
Remarque :
L’outil Rechercher et remplacer ne prend actuellement en charge que les colonnes de type chaîne. Vous devez convertir la colonne de type nombre en chaîne, remplacer la chaîne puis reconvertir la colonne en nombre (entier ou double).
Colonnes de date/heure
Les colonnes de date/heure créent un résumé sous forme de série chronologique. La série chronologique agrège les valeurs de date/heure en intervalles en affiche leur nombre pour chaque intervalle. Le résumé affiche le nombre total d'entités, les dates minimum et maximum et le nombre de valeurs nulles. Utilisez le curseur situé au-dessus de la série chronologique pour faire un zoom avant et voir le graphique à une plus grande échelle. Lorsque le niveau de zoom franchit un seuil donné, l’intervalle temporel se met à jour pour utiliser l’intervalle approprié.
Pour effectuer des sélections sur le résumé de la série chronologique, cliquez sur chaque point temporel. Les sélections sur le résumé de la série chronologique sont répercutées dans la vue tabulaire ou la vue cartographique, le cas échéant.
Voici quelques problèmes que vous êtes susceptible de rencontrer dans le résumé d’une colonne de type date/heure :
- Les dates se situent-elles dans la plage de date requise ? Utilisez l'outil Filter values (Filtrer les valeurs) pour ne conserver que les valeurs qui se situent dans la plage de dates/heures souhaitée.
- Le jeu de données contient-il des espaces réservés ou des valeurs par défaut qui doivent être supprimés (1000-01-01, par exemple) ? Utilisez l’outil Rechercher et remplacer pour remplacer les valeurs par des valeurs nulles s’il y a lieu, ou utilisez l’outil Filtrer les valeurs pour supprimer les lignes contenant les espaces réservés ou les valeurs par défaut.
Remarque :
L’outil Rechercher et remplacer ne prend actuellement en charge que les colonnes de type chaîne. Vous devez convertir la colonne de date/heure en chaîne, remplacer la chaîne puis reconvertir la colonne en date/heure.
Vous avez un commentaire à formuler concernant cette rubrique ?