Remarque :
L’ingénierie des données est disponible dans Insights desktop. Tous les utilisateurs de Insights in ArcGIS Online et Insights in ArcGIS Enterprise ont accès à Insights desktop. Pour plus d’informations, reportez-vous à la rubrique Vue d’ensemble de ArcGIS Insights.
L’ingénierie des données existe actuellement en mode Aperçu.
Les outils du menu Import options (Options d’importation) sont appliqués aux jeux de données lorsqu’ils sont ajoutés à un classeur de données, mais ne sont pas ajoutés au modèle de données.
Outils d'importation
Les outils suivants sont disponibles lorsque vous importez un jeu de données dans un classeur de données :
Outil | Description |
---|---|
Appliquez un filtre avancé au niveau du jeu de données et sélectionnez des champs à inclure dans l'échantillon du jeu de données. | |
Supprimer les espaces vides | Supprimez les espaces vides à partir du début et de la fin des valeurs de chaîne. Cet outil est activé par défaut. |
Choisissez le mode de création de l'échantillon du jeu de données. Cet outil est disponible pour les jeux de données comportant plus de 250 000 enregistrements. |
Utiliser les options d'importation
Pour appliquer les outils d'importation à un jeu de données, procédez comme suit :
- Ouvrez la fenêtre Add to page (Ajouter à la page) à l’aide de l’une des options suivantes :
- Créez un classeur de données. La fenêtre Add to page (Ajouter à la page) s’ouvre une fois le classeur de données créé.
- Cliquez sur le bouton Add to page (Ajouter à la page) au-dessus de la fenêtre de données dans un classeur de données existant.
- Sélectionnez un jeu de données à ajouter au classeur de données.
- Cliquez sur le bouton Import options (Options d'importation) pour accéder aux outils suivants :
- Choisissez Filter dataset (Filtre du jeu de données) pour appliquer un filtre avancé et sélectionner des champs à inclure dans l'échantillon du jeu de données.
- Indiquez si vous voulez supprimer les espaces vides à partir du début et de la fin des valeurs de chaîne (option activée par défaut).
- Si votre jeu de données comporte plus de 250 000 enregistrements, indiquez si vous souhaitez utiliser la méthode d'échantillonnage Random (Aléatoire) (méthode par défaut) ou Fixed (Fixe).
- Cliquez sur Add (Ajouter).
Méthodes d'échantillonnage
On distingue deux méthodes de création des données échantillonnées : Random (Aléatoire) et Fixed (Fixe).
Aléatoire
La méthode d'échantillonnage Random (Aléatoire) sélectionne 250 000 enregistrements au hasard dans le jeu de données. Cette méthode est utile pour créer un échantillon représentatif de valeurs uniques et de plages de nombres. Toutefois, les valeurs avec relativement peu d'occurrences risquent de ne pas être sélectionnées dans l'échantillon. Par exemple, une coquille apparaissant une seule fois dans une colonne de chaîne risque de ne pas être sélectionnée dans l'échantillon aléatoire et vous ne saurez donc pas qu'il faut la corriger lors du processus d'ingénierie des données.
La méthode Random (Aléatoire) est la méthode d'échantillonnage préférée pour la plupart des jeux de données.
Remarque :
Les connecteurs de base de données qui ne sont pas immédiatement pris en charge doivent disposer de fichiers de configuration mis à jour pour prendre en charge l'échantillonnage aléatoire. Si vous n'utilisez pas les fichiers de configuration les plus récents pour un connecteur, vous devez supprimer le type de connecteur puis l'ajouter à nouveau avec les tout derniers fichiers.
Les connexions aux données uniquement à ArcGIS Enterprise ne prennent pas en charge l’échantillonnage aléatoire si Insights 2022.2 ou version supérieure n’est pas installé dans l’organisation.
L'échantillonnage aléatoire peut ne pas être pris en charge pour les données des onglets Living Atlas et ArcGIS public.
Constant
La méthode d'échantillonnage Fixed (Fixe) sélectionne les enregistrements dans l'ordre dans lesquels ils se trouvent dans le jeu de données. La taille de l'échantillon par défaut est de 250 000 enregistrements, mais vous pouvez l'augmenter ou la réduire lors de l'importation du jeu de données.
Utilisez la méthode Fixed (Fixe) si vous voulez augmenter la taille de l'échantillon ou si votre jeu de données fournira un échantillon représentatif si ses enregistrements sont utilisés dans l'ordre.
N'utilisez pas la méthode Fixed (Fixe) pour les jeux de données ordonnés d'une manière qui impacte les valeurs qui existeront dans l'échantillon. Imaginons, par exemple, un jeu de données météorologiques nationales de plusieurs années, mais dont les 250 000 premiers enregistrements correspondent uniquement aux deux premiers mois de données. Ces données ne seront pas représentatives des dates, températures, précipitations et autres conditions météorologiques du jeu de données tout entier.
Vous avez un commentaire à formuler concernant cette rubrique ?