Amazon S3

La source Amazon Simple Storage Service (S3) lit les enregistrements des fichiers stockés dans un paquet Amazon S3 et effectue une analyse dans ArcGIS Velocity.

Exemples

Voici des exemples de cas d’utilisation de la source de données :

  • Un chercheur souhaite charger des centaines de fichiers de texte délimités stockés dans un paquet Amazon S3 vers Velocity pour effectuer une analyse.
  • Un service SIG stocke les shapefiles de limites fréquemment utilisés dans un paquet Amazon S3 et souhaite charger le shapefile de limites de comté dans Velocity en tant que limite d’agrégation.

Remarques sur l’utilisation

Tenez compte des points suivants lorsque vous utilisez la source de données :

  • Tous les fichiers identifiés dans le paquet Amazon S3 par le schéma de dénomination défini pour le paramètre Dataset (Jeu de données) doivent avoir la même structure et le même type de géométrie. Si vous spécifiez un nom de dossier pour le paramètre Dataset (Jeu de données), tous les fichiers des répertoires doivent avoir la même structure et le même type de fichier.
  • La clé d’accès secrète est chiffrée lors du premier enregistrement de l’analyse et stockée dans cet état.
  • Lorsque vous spécifiez le chemin d’accès au dossier, utilisez des symboles de barres obliques.
  • Après avoir configuré les propriétés de connexion à la source, reportez-vous à la rubrique de configuration des données en entrée pour savoir comment définir la structure et les propriétés clés.
  • Si vous utilisez le mode d’accès Public pour vous connecter aux compartiments Amazon S3 publics à l’aide de Velocity, l’action List (Liste) du compartiment Amazon S3 public doit être définie sur Everyone (public access) (Tous [accès public]) dans la liste de contrôle d’accès du compartiment.
  • Certaines actions Amazon S3 sont requises pour les règles utilisateur associées à la clé Amazon fournie, afin que Velocity puisse établir une connexion à un paquet Amazon S3 et aux données du paquet et du chemin d’accès indiqués.
    • L’action s3:ListBucket est requise pour le paquet spécifié.
    • L’action s3:GetObject est requise pour le chemin d’accès au dossier et les sous-ressources spécifiés (arn:aws:s3:::yourBucketName/*) pour qu’une source Amazon S3 puisse lire les données.

Paramètres

Les paramètres de la source de données sont présentés ci-après :

ParamètreDescriptionType de données
Clé d’accès

L’ID de la clé d’accès Amazon pour le paquet S3, par exemple, AKIAIOSFODNN7EXAMPLE.

Velocity utilise la clé d’accès pour charger les sources de données spécifiées dans l’application.

Pour plus de détails sur les clés d’accès Amazon, reportez-vous à la rubrique Accès à AWS avec vos informations d’identification AWS dans la documentation AWS.

Chaîne

Clé secrète

La clé d’accès secrète Amazon pour le paquet S3, par exemple, wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY.

Velocity utilise la clé d’accès pour charger les sources de données spécifiées dans l’application.

La clé d’accès secrète est chiffrée lors du premier enregistrement de l’analyse et stockée dans cet état.

Pour plus de détails sur les clés d’accès secrètes Amazon, reportez-vous à la rubrique Accès à AWS avec vos informations d’identification AWS dans la documentation AWS.

Chaîne

Nom du paquet S3

Nom du paquet Amazon S3 contenant les fichiers à lire.

Chaîne

Chemin d’accès au dossier

Le chemin d’accès du dossier contenant les fichiers à charger dans Velocity.

  • Si vous chargez les fichiers à partir du niveau racine d’un compartiment Amazon S3, saisissez une barre oblique (/).
  • Si les fichiers sont chargés à partir d’un dossier du compartiment Amazon S3, saisissez une barre oblique suivie du chemin d’accès au dossier, par exemple, /gis_data_folder/folder_containing_desired_dataset.

Chaîne

Jeu de données

Nom du fichier à lire, si un seul fichier est chargé, ou schéma identifiant un jeu de fichiers, suivi de l’extension du type de fichier.

Pour créer un schéma identifiant un jeu de fichiers, utilisez un astérisque (*), seul ou associé à un nom de fichier partiel, comme caractère générique.

Tous les fichiers identifiés par le schéma de dénomination doivent posséder la même structure et le même type de géométrie.

Si vous chargez plusieurs fichiers ou des dossiers imbriqués, vous pouvez également définir le nom du dossier conteneur comme nom du jeu de données plutôt qu’un nom de fichier avec une extension. Si vous spécifiez un nom de dossier conteneur comme jeu de données, vous ne pouvez pas utiliser de caractères génériques, ni restreindre les types de fichier. Tous les fichiers du dossier spécifié sont ingérés, et doivent avoir le même type de fichier.

Voici quelques exemples :

  • Un seul fichier d’un dossier - filename.csv
  • Tous les fichiers d’un dossier - *.shp
  • Choisir les fichiers dans un dossier — sensor_data_201*.json
  • Tous les fichiers d’un répertoire ou d’un répertoire de répertoires (sous-répertoires) - containingFolderName

Chaîne

Charger uniquement les fichiers récents

Indique si la source Amazon S3 charge tous les fichiers, ou seulement ceux créés ou modifiés depuis la dernière exécution de l’analyse.

  • La valeur par défaut est false (faux), ce qui implique que, lors de chaque exécution de l’analyse, tous les fichiers du paquet et du chemin d’accès spécifiés portant le nom de jeu de données indiqué sont chargés.
  • Lorsque la valeur true (vrai) est définie, seuls les fichiers modifiés ou créés sont chargés lors de chaque exécution de l’analyse.

Le paramètre ne peut être défini sur true (vrai) que pour les analyses de Big Data programmées.

Lors de la première exécution d’une analyse de Big Data programmée avec le paramètre défini sur true (vrai), l’analyse s’exécute entièrement sans charger aucun fichier. Lors des analyses suivantes, les fichiers dont la date de dernière modification est postérieure à la date de la dernière analyse programmée sont chargés.

Booléen

Considérations et limitations

Considérez ce qui suit lorsque vous utilisez la source de données :

  • Tous les fichiers identifiés dans le paquet Amazon S3 par le schéma de dénomination défini dans la propriété de jeu de données doivent posséder la même structure et le même type de géométrie.
  • L’ingestion de données JSON avec une matrice d’objets référencée par un nœud racine n’est pas prise en charge actuellement pour la source Amazon S3 et la source Stockage Blob Azure.