Utiliser les outils de colonne

Insights desktop
Remarque :

L'ingénierie des données est disponible dans Insights desktop. Tous les utilisateurs de Insights in ArcGIS Online et Insights in ArcGIS Enterprise ont accès à Insights desktop. Pour plus d’informations, reportez-vous à la rubrique Vue d’ensemble de ArcGIS Insights.

L'ingénierie des données existe actuellement en mode Aperçu.

Les outils de colonne servent à apporter des modifications aux données d’une colonne spécifique et sont accessibles dans chaque colonne des tables, sous le modèle de données. Une fois appliqués, les outils de colonne sont ajoutés au modèle de données.

Convertir le type de données

Les types de données sont appliqués à chaque colonne dans Insights. Selon la mise en forme de vos données en entrée, le type de données par défaut peut ne pas être correct pour toutes les colonnes. Par exemple, les fichiers .csv ne prenant pas en charge le format date/heure, les colonnes de date/heure sont importées en tant que chaînes.

Les colonnes peuvent être converties dans les types de données suivants : chaîne, entier, double ou date/heure.

Pour utiliser l'outil Convert data type (Convertir le type de données), procédez comme suit :

  1. Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
  2. Cliquez sur la flèche en regard du nom d'une colonne pour en développer le menu d'outils.
    Remarque :

    Si votre vue est uniquement tabulaire, cliquez sur le bouton Views (Vues)Vues et choisissez Table ou Model and table (Modèle et table) dans le menu.

  3. Choisissez Convert data type (Convertir le type de données) :
  4. Pour Output data type (Type de données en sortie), choisissez le type de données dans lequel vous voulez convertir la colonne et appliquez les options de mise en forme nécessaires :
    • Si vous convertissez une colonne en date/heure, saisissez le format de date/heure.
    • Si vous convertissez une colonne en entier ou double, sélectionnez le type de séparateur décimal utilisé dans vos données (point ou virgule).
  5. Cliquez sur Apply (Appliquer).

La colonne est convertie dans le type de données sélectionné.

Entier

Les types de données Entier sont des nombres sans décimale.

Toute colonne avec des nombres peut être convertie en entier. Si la colonne contient des caractères qui ne sont pas des nombres, ils sont supprimés.

Si la colonne contient des valeurs décimales, celles-ci sont supprimées, sans que le nombre soit arrondi. Si vous voulez qu'il le soit, convertissez la colonne en type de données Double et calculez une nouvelle colonne en utilisant la fonction ROUND().

Les données de type Entier sont lues comme des champs numériques dans les classeurs Insights.

Double

Les données de type Double (ou à virgule flottante à double précision) sont des nombres acceptant les valeurs décimales.

Toute colonne avec des nombres peut être convertie en double. Si la colonne contient des caractères qui ne sont pas des nombres, ils sont supprimés.

Les données de type Double sont lues comme des champs numériques dans les classeurs Insights.

Date/heure

Les colonnes de date/heure peuvent être des dates uniquement, des heures uniquement ou une date et une heure.

Un format de date/heure est requis pour convertir une colonne en de type date/heure. Le format de date/heure par défaut est ISO 8601. Si vos données ne sont pas au format ISO 8601, vous devez changer le format dans la zone Custom format (Format personnalisé) et choisir celui qui correspond à vos données.

Remarque :

Toutes les dates et heures d'une même colonne doivent utiliser le même format. Une bonne pratique consiste à inclure un composant de période pour toutes les valeurs d'heure selon une horloge de 12 heures pour garantir l'exactitude de l'heure utilisée.

Les variables suivantes sont prises en charge pour créer votre format de date/heure :

Composant de date/heureVariableValeurs prises en charge

Mois

MM

01 à 12

V

1 à 12

Jour

DD

01 à 31

D

1 à 31

Année

AAAA

Année à quatre chiffres

AA

Année à deux chiffres (00 à 99)

Heure

HH

01 à 24

H

1 à 24

hh

01 à 12

h

1 à 12

Minute

mm

01 à 59

m

1 à 59

Seconde

ss

01 à 59

s

1-59

Période

Un

AM, PM ou le format de période pris en charge dans vos paramètres régionaux.

a

Fuseau horaire

ZZ

+HHmm or -HHmm

TZD

+hh:mm ou -hh:mm

Filtrer les valeurs

Les filtres attributaires utilisent des requêtes pour supprimer les données non nécessaires de votre jeu de données. Cet outil permet de réduire la taille du jeu de données et de n'y inclure que les données pertinentes pour votre analyse. Par exemple, vous pouvez supprimer les entrées avec des valeurs nulles ou filtrer les données sur une zone d'étude spécifique ou une plage de dates.

Pour utiliser l'outil Filter values (Filtrer les valeurs), procédez comme suit :

  1. Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
  2. Cliquez sur la flèche en regard du nom d'une colonne pour en développer le menu d'outils.
    Remarque :

    Si votre vue est uniquement tabulaire, cliquez sur le bouton Views (Vues)Vues et choisissez Table ou Model and table (Modèle et table) dans le menu.

  3. Choisissez Filter values (Filtrer les valeurs).
  4. Effectuez l’une des opérations suivantes :
    • Pour faire un filtre sur des colonnes de chaîne, sélectionnez ou désélectionnez les valeurs uniques que vous voulez afficher ou exclure.
    • Pour faire un filtre sur des colonnes de nombre ou de taux/ratio, ajustez le curseur aux extrémités inférieure et supérieure de la plage, ou cliquez sur les nœuds et saisissez une nouvelle valeur.
    • Pour faire un filtre sur des colonnes de date/heure, utilisez les boutons de calendrier et d’horloge pour ajuster respectivement les dates de début et de fin et les heures de début et de fin. Vous pouvez également saisir directement une date ou une heure dans le filtre.

    Pour plus d'informations sur l'application des paramètres de filtre pour chaque type de données, reportez-vous à la rubrique Filtrer les données.

  5. Cliquez sur Apply (Appliquer).

Le filtre est appliqué et les lignes qui ne correspondent pas aux critères sont supprimées.

Rechercher et remplacer

Remarque :

L'outil Find and replace (Rechercher et remplacer) est actuellement disponible pour les colonnes de chaîne. Pour remplacer les valeurs dans les colonnes de nombre et de date/heure, vous devez convertir la colonne en chaîne, remplacer la chaîne puis reconvertir la colonne dans son type de données initial.

L'outil Rechercher et remplacer permet de rechercher des valeurs spécifiques dans la colonne et de les remplacer par une nouvelle valeur. Cet outil permet, entre autres, de remplacer des espaces réservés ou des valeurs par défaut par des valeurs nulles, corriger des fautes d'orthographe dans des chaînes ou créer des casses cohérentes.

Pour utiliser l'outil Find and replace (Rechercher et remplacer), procédez comme suit :

  1. Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
  2. Cliquez sur la flèche en regard du nom d'une colonne pour en développer le menu d'outils.
    Remarque :

    Si votre vue est uniquement tabulaire, cliquez sur le bouton Views (Vues)Vues et choisissez Table ou Model and table (Modèle et table) dans le menu.

  3. Choisissez Find and replace (Rechercher et remplacer).
  4. Effectuez l’une des opérations suivantes :
    • Pour rechercher et remplacer des chaînes personnalisées, restez sur l'onglet String (Chaîne) (par défaut). Dans la zone Find (Rechercher), saisissez une chaîne personnalisée à rechercher dans la colonne. Sélectionnez Match Cases (Respecter la casse) pour que la recherche tienne compte de la casse, puis sélectionnez Match whole word only (Mot entier uniquement) pour ne renvoyer que les correspondances de la chaîne entière, le cas échéant.
    • Pour rechercher et remplacer des chaînes vides, cliquez sur l'onglet Empty (Vide).
    • Pour rechercher et remplacer les valeurs nulles, cliquez sur l'ongletNull.
  5. Dans la zone Replace with (Remplacer par), saisissez la chaîne qui doit remplacer les chaînes trouvées par la recherche. Laissez la zone Replace with (Remplacer par) à blanc si vous voulez que les chaînes renvoyées par la recherche soient remplacées par des chaînes vides. Si vous remplacez des chaînes vides par des valeurs nulles (Empty string (Chaîne vide)), sélectionnez Replace with null (Remplacer par la valeur Null).
  6. (Facultatif) Cliquez sur Find (Rechercher) pour rechercher et mettre en évidence les chaînes trouvées.
  7. Cliquez sur Replace (Remplacer) pour rechercher et remplacer les chaînes trouvées par la recherche.
  8. Répétez les étapes pour rechercher et remplacer d'autres chaînes ou cliquez sur Done (Terminé) pour fermer la boîte de dialogue.

Les chaînes renvoyées sont mises à jour.

Supprimer une colonne

L'outil Remove column (Supprimer une colonne) permet d'exclure les colonnes non nécessaires d'un jeu de données en sortie. Une colonne supprimée ne peut pas être affichée ultérieurement pendant l'analyse à l'aide de l'option Shown hidden fields (Afficher les champs masqués). La suppression d'une colonne n'intervient que dans le jeu de données en sortie et n'affecte pas le jeu de données source, où la colonne est conservée.

Pour supprimer une colonne d'un jeu de données, procédez comme suit :

  1. Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
  2. Cliquez sur la flèche en regard du nom d'une colonne pour en développer le menu d'outils.
    Remarque :

    Si votre vue est uniquement tabulaire, cliquez sur le bouton Views (Vues)Vues et choisissez Table ou Model and table (Modèle et table) dans le menu.

  3. Choisissez Remove column (Supprimer une colonne).

La colonne est supprimée de la table.

Afficher le résumé de la colonne

L'outil Show column summary (Afficher le résumé de la colonne) crée un diagramme de distribution et calcule des statistiques à l'aide des données de la colonne. Le résumé permet ensuite de rechercher des problèmes dans vos données (fautes d'orthographe, points aberrants, etc.).

Remarque :

Show column summary (Afficher le résumé de la colonne) crée une visualisation des valeurs dans une colonne au lieu de changer effectivement les valeurs. Par conséquent, l’outil Afficher le résumé de la colonne n’est pas ajouté au modèle de données.

Pour créer un résumé de colonne, procédez comme suit :

  1. Ouvrez un classeur de données dans Insights desktop et ajoutez des données, si nécessaire.
  2. Cliquez sur la flèche en regard du nom d'une colonne pour en développer le menu d'outils.
    Remarque :

    Si votre vue est uniquement tabulaire, cliquez sur le bouton Views (Vues)Vues et choisissez Table ou Model and table (Modèle et table) dans le menu.

  3. Cliquez sur Show column summary (Afficher le résumé de la colonne).

Un volet latéral s'affiche, avec un diagramme et des statistiques pour la colonne.

Colonnes de chaîne

Les colonnes de chaîne créent un résumé sous forme de diagramme à barres. Le diagramme à barres affiche les valeurs uniques de la colonne avec le nombre d'entités tandis que le résumé affiche les statistiques pour le nombre total d'entités, le nombre de valeurs nulles, le nombre de chaînes vides et le nombre total de valeurs uniques. Utilisez le curseur sur le côté du diagramme pour faire un zoom avant et voir toutes les valeurs uniques, le cas échéant. Cliquez sur le bouton Sort (Tri)Trier pour trier le diagramme en ordre croissant, décroissant ou alphabétique.

Recherchez les problèmes suivants dans le résumé de la colonne de chaîne :

  • Est-ce que la colonne contient des valeurs nulles ou des chaînes vides ? Les valeurs nulles et les chaînes vides seront analysées séparément. Utilisez l'outil Find and replace (Rechercher et remplacer) pour remplacer des valeurs nulles par des chaînes vides et inversement.
  • Toutes les valeurs utilisent-elles une casse cohérente ? Une incohérence de casse peut entraîner la séparation incorrecte de valeurs qui devraient être agrégées en une seule valeur unique. Utilisez l'outil Find and replace (Rechercher et remplacer) pour rechercher une chaîne en respectant la casse et remplacer toutes les valeurs trouvées par une seule valeur.
  • La colonne contient-elle des fautes d'orthographe ? Les fautes d'orthographe peuvent entraîner des agrégations inadéquates. Utilisez l'outil Find and replace (Rechercher et remplacer) pour rechercher la faute et la remplacer par la valeur correctement orthographiée.

Colonnes de nombre

Les colonnes de nombre créent un résumé sous forme d'histogramme. L’histogramme agrège les nombres dans des classes et affiche la fréquence des valeurs au sein de chaque classe. Les valeurs moyenne et médiane sont affichées dans l'histogramme et le résumé affiche les statistiques pour le nombre total d'entité, le nombre de valeurs nulles, la moyenne, la moyenne approximative, le quartile supérieur et inférieur, l'écart type, l'inclinaison et le coefficient d'aplatissement. Utilisez le curseur sous l'axe x pour changer le nombre de classes dans l'histogramme.

Recherchez les problèmes suivants dans le résumé de la colonne de nombre :

  • Le jeu de données contient-il des points aberrants ou des valeurs en dehors de la plage attendue ? Par exemple, si la colonne comprend des valeurs de pourcentage, la plage attendue va de 0 à 100. Utilisez l'outil Filter values (Filtrer les valeurs) pour supprimer les lignes contenant des valeurs incorrectes.
  • Les données sont-elles distribuées normalement ? Certaines analyses statistiques, comme Créer un modèle de régression, exigent que les données soient réparties normalement. Utilisez l'outil Calculate column (Calculer la colonne) pour appliquer une transformation à la colonne.
  • Le jeu de données contient-il des espaces réservés ou des valeurs par défaut qui doivent être supprimés (9999, par exemple) ? Utilisez l'outil Find and replace (Rechercher et remplacer) pour remplacer les valeurs par Null, ou utilisez l'outil Filter values (Filtrer les valeurs) pour supprimer les lignes contenant les espaces réservés ou les valeurs par défaut.
    Remarque :

    L'outil Find and replace (Rechercher et remplacer) ne prend actuellement en charge que les colonnes de chaîne. Vous devez convertir la colonne de nombre en chaîne, remplacer la chaîne puis reconvertir la colonne en nombre (entier ou double).

Colonnes de date/heure

Les colonnes de date/heure créent un résumé sous forme de série chronologique. La série chronologique agrège les valeurs de date/heure en intervalles en affiche leur nombre pour chaque intervalle. Le résumé affiche le nombre total d'entités, les dates minimum et maximum et le nombre de valeurs nulles. Utilisez le curseur situé au-dessus de la série chronologique pour faire un zoom avant et voir le graphique à une plus grande échelle. Lorsque le niveau de zoom franchit un seuil donné, l’intervalle temporel se met à jour pour utiliser l’intervalle approprié.

Recherchez les problèmes suivants dans le résumé de la colonne de date/heure :

  • Les dates se situent-elles dans la plage de date requise ? Utilisez l'outil Filter values (Filtrer les valeurs) pour ne conserver que les valeurs qui se situent dans la plage de dates/heures souhaitée.
  • Le jeu de données contient-il des espaces réservés ou des valeurs par défaut qui doivent être supprimés (1000-01-01, par exemple) ? Utilisez l'outil Find and replace (Rechercher et remplacer) pour remplacer les valeurs par Null, ou utilisez l'outil Filter values (Filtrer les valeurs) pour supprimer les lignes contenant les espaces réservés ou les valeurs par défaut.
    Remarque :

    L'outil Find and replace (Rechercher et remplacer) ne prend actuellement en charge que les colonnes de chaîne. Vous devez convertir la colonne de date/heure en chaîne, remplacer la chaîne puis reconvertir la colonne en date/heure.