Détails de la configuration du serveur

En tant que composant essentiel du SIG Web, ArcGIS Open Data communique avec des milliers de serveurs du monde entier via la spécification GeoServices REST ouverte. Ces serveurs exécutent différentes versions d'ArcGIS Server allant de 10.0 à 10.3.1 et fonctionnent sur une infrastructure gérée par des agences faisant autorité ou peuvent se situer dans un cloud hébergé sur ArcGIS Online. Pour gérer les différentes performances des serveurs de ces diverses informations sur le Web, il est recommandé de prendre en compte les points suivants lors de la publication des données.

Propriétés du service

Le nombre maximum d'enregistrements doit être inférieur à 5 000

Lorsque vous publiez un service, un nombre maximum d'enregistrements par défaut de 1 000 ou 2 000 est défini et destiné à offrir des performances optimales de votre serveur vers le client. Le nombre maximum d'enregistrements détermine le nombre maximum d'entités pouvant être renvoyées dans une seule requête. Lorsque ce nombre est défini sur une valeur trop élevée pour un serveur, un client peut essayer de demander toutes les données dans une seule requête dont la génération est lente et dont la taille est trop importante pour un envoi par Internet.

Il peut être judicieux d'utiliser une valeur supérieure à la plage par défaut si votre couche ou table comprend un peu plus de 2 000 ou autour de 4 000 entités au total.

Pour les services dont le nombre d'enregistrements maximum est supérieur à 5 000, l'administrateur reçoit un message d'avertissement dans l'application d'administration Open Data suggérant sa réduction. Même si cela implique qu'un moins grand nombre d'entités peuvent s'afficher sur la carte, cela signifie également qu'un client n'a pas à attendre trop longtemps que la carte apparaisse. Les utilisateurs voient des visualisations quadrillées lorsque la carte ne parvient pas à afficher toutes les entités à la fois.

Les services dont le nombre d'enregistrements maximum est supérieur à 10 000 ne sont pas indexés par Open Data et une erreur est signalée à l'administrateur. Ce comportement a lieu également pour des raisons de performances, car la collecte de toutes les données à chaque consultation surcharge le serveur et ralentit l'affichage des données par l'utilisateur.

Il est important de noter que, quel que soit le nombre d'enregistrements maximum, ArcGIS Open Data interroge toutes les données par groupe de 1 000 enregistrements à la fois et les agrège pour prendre en charge les téléchargements de fichiers au format CSV, KML, SHP ou GeoJSON.

Les liens OGC proviennent d'ArcGIS Server

Des liens WMS, WFS et WCS sont ajoutés dans la section API de l'interface lorsqu'un éditeur de service les a activés sur le service spécifique. Si l'éditeur n'a pas activé ces fonctionnalités au moment de la publication, il peut modifier le service et les activer. Ensuite, l'administrateur doit réindexer le jeu de données spécifique ou le site entier s'il affecte plusieurs jeux de données. Notez que les liens OGC apparaissent uniquement dans les services d'ArcGIS Server 10.2 ou version supérieure.

L'accès aux entités n'est pas nécessaire

ArcGIS Open Data interroge les entités du service de carte comme il interroge les entités d'un service d'entités. A moins d'avoir un besoin particulier d'activer l'accès aux entités, il est préférable de le laisser désactivé.

Les dépendances d'échelle importent peu

ArcGIS Open Data fonctionne en envoyant des requêtes à vos services de carte ou d'entités et en interrogeant les données, quelle que soit l'étendue. Même si, cartographiquement parlant, vous ne voulez pas afficher des points d'adresse à une échelle globale, ArcGIS Open Data interroge toutes les données et offre des visualisations de haut niveau des données en affichant un résumé des emplacements ou une visualisation quadrillée qui peut être filtrée et affiche la densité des entités.

Organisation des services

Les services volumineux vont expirer

L'organisation de vos données dans plusieurs services offre de meilleures performances que placer toutes vos données dans un service. Même si cela est techniquement possible, cela engendre un goulot d'étranglement au niveau des performances, car toutes les données ne sont disponibles que via un point de terminaison unique. Les fournisseurs ont utilisé un service unique dans le but de contrôler les instances minimum et maximum d'un service et l'utilisation d'Open Data. Si vous ne voulez pas partager vos services existants sous forme d'Open Data, publiez plusieurs services qui sont organisés par catégorie de données. Chaque service ne doit pas comporter plus de 20 couches.

Avec un nombre optimal de données ou couches par service, nous pouvons assurer la réactivité des requêtes adressées au serveur et offrir une expérience utilisateur de qualité à vos consommateurs. Si une requête adressée à votre serveur visant à obtenir le nombre d'enregistrements prend plus de 90 secondes, le jeu de données n'est pas indexé et une erreur est signalée à l'administrateur.

Les services doivent être accessibles au public

ArcGIS Open Data contient un processus qui interroge les informations statistiques du serveur afin d'afficher un résumé des données et émet des requêtes de données de 1 000 enregistrements à la fois afin de constituer un cache visant à prendre en charge le téléchargement des types de fichiers. Ce processus d'extraction, transformation et chargement (ETL) automatique est exécuté lorsqu'un utilisateur tente de télécharger les données. Après la mise en cache, la demande de téléchargement répond à partir du cache en vue de décharger le serveur. Ces deux services d'indexation et de création du cache doivent communiquer avec le serveur à travers le pare-feu.

Etendre votre infrastructure sur le cloud

Les serveurs atteignent une certaine capacité à un moment donné, ou une organisation n'expose pas son instance ArcGIS Server pour des raisons de sécurité. Dans les deux cas, les administrateurs ont la possibilité de publier les couches de données sur ArcGIS Online et d'exploiter l'architecture hébergée qui offre un temps de disponibilité de 99,9 pour cent. L'hébergement des données sur ArcGIS Online utilise des crédits, mais il s'agit d'un moyen facultatif de rendre vos données accessibles au public.

En tant qu'organisation, vous pouvez héberger des jeux de données particulièrement volumineux ou populaires sur ArcGIS Online en vue de reporter le trafic Web de vos serveurs sur le cloud. Cette approche hybride est relativement répandue pour Open Data, et les fournisseurs voient également les avantages de l'hébergement sur le cloud dans la plateforme ArcGIS, car les données sont accessibles, gérées, modifiées et utilisées dans de nombreuses applications COTS.

Activer le classement permanent des couches

Lorsque vous ajoutez une couche dans ArcGIS Online pour qu'elle soit utilisée dans Open Data, un numéro est attribué à l'URL du service afin que la requête soit adressée à la couche appropriée. Cela peut poser problème dans les versions antérieures d'ArcGIS Server lorsque les modifications apportées aux services affectent l'ordre de ces numéros. Dans ArcGIS Server 10.3, dans les propriétés du bloc de données MXD du service de carte, vous pouvez activer des ID de couche permanents. Cela signifie que si les couches sont réorganisées ou si de nouvelles données sont ajoutées ou supprimées du service, les liens existants ne sont pas endommagés.

Les données raster sont prises en charge en tant que services d'imagerie

Les couches de services d'imagerie sont indexées par Open Data et peuvent être téléchargées dans des formats d'exportation pris en charge, tels que JPEG, PNG ou les fichiers TIFF géoréférencés. La taille de l'image pouvant être téléchargée est configurée au niveau du service. Si les couches raster font partie d'un service de carte, l'administrateur est informé que des données ne sont pas prises en charge dans le service.

Gestion des données

Modifier les noms de champ à l'aide d'un alias

Lorsque vous créez les données, les noms énigmatiques qui peuvent être attribués aux colonnes attributaires sont inutiles à l'utilisateur lorsqu'ils apparaissent dans Open Data. Ces noms énigmatiques pouvant être nécessaires dans d'autres applications métier, au lieu de changer le nom de la colonne, vous pouvez appliquer un alias de champ. L'alias de champ défini dans ArcMap avant la publication est utilisé par le serveur (sur site ou hébergé) et peut être mis à jour en le modifiant et en le republiant avec l'option de remplacement du service existant.

Désactiver les champs qui ne sont pas importants

Les données que vous créez et gérez servent souvent à prendre en charge des applications internes ou proviennent d'autres systèmes qui représentent généralement des valeurs clés à lier à d'autres données. Ces champs supplémentaires peuvent entraîner une certaine confusion chez les utilisateurs de données et doivent être masqués dans le document ArcMap avant de publier la couche. Ces champs peuvent être mis à jour en les modifiant et en les republiant avec l'option de remplacement du service existant.

Les comportements des géodatabases ne sont pas pris en charge

Les données fournies comme Open Data sont destinées à être proposées dans des formats lisibles. Le processus ETL automatique intégré à ArcGIS Open Data fournit les formats lisibles de type CSV, KML, fichier de formes et GeoJSON. Ces formats de données ne connaissent pas le comportement des géodatabases qui est compris par le niveau de traitement ArcObjects au sein d'ArcGIS. Par conséquent, les comportements, tels que les topologies (jeux de données réseau, atelier parcellaire et réseaux géométriques) et les relations gérées dans la base de données sous forme de différentes classes de relations, ne sont pas pris en charge. Les données de la classe d'entités peuvent être traitées dans ces formats, mais les fonctionnalités supplémentaires ne sont pas importées.

Si vous utilisez des classes de relations ou d'autres formes de données associées, vous pouvez partager les tables individuelles sous forme Open Data en plus de la classe d'entités spatiales. Il est important d'utiliser la description des données pour indiquer ce qui est associé, d'utiliser les balises appropriées et d'organiser vos services. Les tables non spatiales et la classe d'entités peuvent provenir du même service et apparaissent comme associées dans Open Data.

Les domaines de valeurs précodées sont pris en charge

Contrairement à la section précédente, un comportement de la géodatabase est pris en charge lors de la génération des formats lisibles. Les domaines de valeurs précodées sont respectés lors de l'affichage des jeux de données dans Open Data et lorsque les données sont téléchargées, les valeurs brutes sont remplacées par la valeur précodée.

Les données doivent prendre en charge les statistiques

Lorsque vous publiez des données sur ArcGIS Server 10.03 ou version ultérieure, une grande majorité de jeux de données prend en charge les statistiques de manière native. Cela permet à Open Data de fournir un résumé des données à l'utilisateur afin qu'il visualise rapidement les valeurs stockées dans les données. Si l'administrateur remarque que le jeu de données ne prend pas en charge les statistiques, nous vous conseillons de consulter les journaux du serveur et de contacter l'assistance technique si nécessaire.

Dans un souci d'efficacité vis-à-vis de l'utilisateur et afin de réduire les requêtes adressées au serveur, Open Data ne génère des statistiques que pour les 20 premières colonnes d'un jeu de données.

Les fichiers CSV dont la taille est inférieure à 5 Mo sont dynamiques

Lorsque vous chargez des fichiers CSV dans ArcGIS Online, vous avez la possibilité de géocoder les données sur la carte, ce qui génère des données spatialisées. Si les données ne possèdent pas d'informations de localisation, vous pouvez toujours charger le fichier CSV dans ArcGIS Online. Si la taille du fichier CSV est inférieure à 5 Mo et s'il est partagé dans un groupe Open Data, ArcGIS Open Data rend les données interactives et offre un point de terminaison d'API aux développeurs.

Si la taille du fichier CSV est supérieure à 5 Mo et s'il est partagé dans un groupe Open Data, ArcGIS Open Data offre un lien de téléchargement des données. Pour rendre ces fichiers CSV plus volumineux dynamiques, choisissez l'option de publication en tant que service lors du chargement dans ArcGIS Online. Une fois le service créé, vous pouvez le partager dans n'importe quel groupe Open Data. ArcGIS Open Data permettra aux utilisateurs d'interroger, de filtrer et de représenter les données et offrira des points de terminaison d'API aux développeurs.

Activer le suivi de l’éditeur

L'activation du suivi de l'éditeur sur vos données crée un nouveau champ de date qui est automatiquement mis à jour à chaque modification des données. Ceci peut facilement être activé sur les données hébergées dans ArcGIS Online, ainsi qu'avec vos données locales publiées sur ArcGIS Server. Lors de l'activation du suivi de l'éditeur sur vos données locales, utilisez le nom de champ par défaut pour que nous puissions avec précision signaler quand les données ont été mises à jour pour la dernière fois et garantir que les utilisateurs reçoivent en permanence les données les plus actuelles.

Configuration de l'élément

Le titre de l'élément est le nom du jeu de données

De nombreux fournisseurs attribuent couramment des noms internes aux jeux de données lorsqu'ils les stockent dans leur base de données. Pour contourner ces conventions de noms, ArcGIS Open Data utilise le titre de l'élément ArcGIS Online comme nom du jeu de données. Cette démarche permet de mettre à jour, gérer et modifier les noms des jeux de données de manière souple, sans affecter les applications métier dépendantes.

Le champ Contraintes d'accès et d'utilisation correspond à la licence des données

Dans ArcGIS Online, chaque élément comporte une section permettant de fournir des informations dans le champ Contraintes d'accès et d'utilisation. ArcGIS Open Data interprète ce champ comme étant la licence des données. L'application d'une licence à vos données peut être importante pour que les utilisateurs des données sachent comment utiliser les données et à qui accorder le crédit de leur utilisation. Si vous oubliez d'entrer des informations dans cette boîte de dialogue, un avertissement informe les administrateurs que le jeu de données ne contient aucune licence.

De nombreux fournisseurs utilisent les liens vers les stratégies de données qu'ils utilisent, tandis que d'autres génèrent une licence Creative Commons. A l'aide du sélecteur de licences Creative Commons, vous pouvez activer la saisie de code HTML dans cette section des détails des éléments, et vous pouvez entrer le code généré par le sélecteur de licences.

La recherche de données repose sur l'étendue de l'élément

Si vos données couvrent une certaine zone, mais que dans les résultats de recherche, vous voyez qu'elles semblent couvrir le monde entier ou qu'elles sont ancrées sur Null Island, vous devez mettre à jour l'étendue spatiale de l'élément ArcGIS Online. Lorsque l'élément est créé, il tente d'obtenir la meilleure étendue possible, mais des anomalies peuvent parfois être générées. La définition de l'étendue dans l'élément vous permet de personnaliser l'étendue que les données couvrent et d'améliorer la recherche de vos données.

Outre la rectification des étendues anormales, la définition de l'étendue des fichiers CSV, des données non spatiales ou des liens vers des documents vous permet d'offrir un emplacement général pour les données. Même si le rapport PDF ne possède pas d'emplacement X,Y explicite, il dispose d'un emplacement général associé à votre instance organisationnelle.