La source Amazon S3 lit les enregistrements des fichiers stockés dans un paquet Amazon S3 et effectue une analyse dans ArcGIS Velocity.
Exemples
Voici quelques exemples d’utilisation de la source Amazon S3 :
- Un chercheur souhaite charger des centaines de fichiers de texte délimités stockés dans un paquet Amazon S3 vers Velocity pour effectuer une analyse.
- Un service SIG stocke les shapefiles de limites fréquemment utilisés dans un paquet Amazon S3 et souhaite charger le shapefile de limites de comté dans Velocity en tant que limite d’agrégation.
Remarques sur l’utilisation
Tenez compte des points suivants lorsque vous utilisez la source Amazon S3 :
- Tous les fichiers identifiés dans le paquet Amazon S3 par le schéma de dénomination défini pour le paramètre Dataset (Jeu de données) doivent avoir la même structure et le même type de géométrie. Si vous spécifiez un nom de dossier pour le paramètre Dataset (Jeu de données), tous les fichiers des répertoires doivent avoir la même structure et le même type de fichier.
- La clé d’accès secrète est chiffrée lors du premier enregistrement de l’analyse et stockée dans cet état.
- Lorsque vous spécifiez le chemin d’accès au dossier, utilisez des barres obliques (/).
- Après avoir configuré les propriétés de connexion à la source, consultez la rubrique Configurer les données en entrée pour savoir comment définir la structure et les propriétés clés.
- Si vous utilisez le mode d’accès Public pour vous connecter aux paquets Amazon S3 publics à l’aide de Velocity l’action List (Liste) du paquet Amazon S3public doit être attribuée à Everyone (public access) [Tous (accès public)] dans la liste de contrôle d’accès du paquet.
- Certaines actions Amazon S3 sont requises pour les règles utilisateur associées à la clé Amazon fournie, afin que Velocity puisse établir une connexion à un paquet Amazon S3 et aux données du paquet et du chemin d’accès indiqués.
- L’action s3:ListBucket est requise pour le paquet spécifié.
- L’action s3:GetObject est requise pour le chemin d’accès au dossier et les sous-ressources spécifiés (arn:aws:s3:::yourBucketName/*) pour qu’une source Amazon S3 puisse lire les données.
Paramètres
Paramètre | Description | Type de données |
---|---|---|
Clé d’accès | L’ID de la clé d’accès Amazon pour le paquet S3, par exemple, AKIAIOSFODNN7EXAMPLE. Velocity utilise la clé d’accès pour charger les sources de données spécifiées dans l’application. Pour plus de détails sur les clés d’accès Amazon, reportez-vous à la rubrique Accessing AWS using your AWS credentials de la documentation relative à AWS. | Chaîne |
Clé secrète | La clé d’accès secrète Amazon pour le paquet S3, par exemple, wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY. Velocity utilise la clé d’accès pour charger les sources de données spécifiées dans l’application. La clé d’accès secrète est chiffrée lors du premier enregistrement de l’analyse et stockée dans cet état. Pour plus de détails sur les clés d’accès secrètes Amazon, reportez-vous à la rubrique Accessing AWS using your AWS credentials de la documentation relative à AWS. | Chaîne |
Nom du paquet S3 | Nom du paquet Amazon S3 contenant les fichiers à lire. | Chaîne |
Chemin d’accès au dossier | Le chemin d’accès du dossier contenant les fichiers à charger dans Velocity.
| Chaîne |
Jeu de données | Nom du fichier à lire, si un seul fichier est chargé, ou schéma identifiant un jeu de fichiers, suivi de l’extension du type de fichier. Pour créer un schéma identifiant un jeu de fichiers, utilisez un astérisque (*), seul ou associé à un nom de fichier partiel, comme caractère générique. Tous les fichiers identifiés par le schéma de dénomination doivent posséder la même structure et le même type de géométrie. Si vous chargez plusieurs fichiers ou des dossiers imbriqués, vous pouvez également définir le nom du dossier conteneur comme nom du jeu de données plutôt qu’un nom de fichier avec une extension. Si vous spécifiez un nom de dossier conteneur comme jeu de données, vous ne pouvez pas utiliser de caractères génériques, ni restreindre les types de fichier. Tous les fichiers du dossier spécifié sont ingérés, et doivent avoir le même type de fichier. Voici quelques exemples :
| Chaîne |
Charger uniquement les fichiers récents | Indique si la source Amazon S3 charge tous les fichiers, ou seulement ceux créés ou modifiés depuis la dernière exécution de l’analyse.
Ce paramètre ne peut être défini sur true (vrai) que pour les analyses de Big Data programmées. Lors de la première exécution d’une analyse de Big Data programmée avec ce paramètre défini sur true (vrai), l’analyse s’exécute entièrement sans charger aucun fichier. Lors des analyses suivantes, les fichiers dont la date de dernière modification est postérieure à la date de la dernière analyse programmée sont chargés. | Booléen |
Considérations et limitations
Vous devez prendre en compte certains points lorsque vous utilisez la source Amazon S3 :
- Tous les fichiers identifiés dans le paquet Amazon S3 par le schéma de dénomination défini dans la propriété de jeu de données doivent posséder la même structure et le même type de géométrie.
- L’ingestion de données JSON avec une matrice d’objets référencée par un nœud racine n’est pas prise en charge actuellement pour la source Amazon S3 et la source Stockage Blob Azure.
Vous avez un commentaire à formuler concernant cette rubrique ?