Supprimer les doublons (Gestion des données)

Synthèse

Supprime les enregistrements d’une table ou d’une classe d’entités qui ont des valeurs identiques dans un ensemble de champs. Si le champ de géométrie est sélectionné, les géométries de l’entité sont comparées.

L’outil Rechercher les doublons permet de signaler les enregistrements considérés comme identiques sans pour autant les supprimer.

Utilisation

    Attention :

    Cet outil modifie les données en entrée. Pour plus d’informations et connaître les stratégies permettant d’empêcher les modifications de données indésirables, reportez-vous à la rubrique Outils qui modifient ou mettent à jour les données en entrée.

  • Pour chaque ensemble d’enregistrements identiques, l’outil supprime tous les enregistrements identiques sauf le premier. L’ordre des enregistrements identiques est le même que celui renvoyé par l’outil Rechercher les doublons.

  • Les valeurs de plusieurs champs du jeu de données en entrée sont comparées. Si plusieurs champs sont indiqués, les enregistrements sont mis en correspondance en fonction des valeurs du premier champ, puis des valeurs du deuxième champ, et ainsi de suite.

  • Avec une classe d’entités ou une couche d’entités en entrée, utilisez le champ de géométrie du paramètre Champ(s) pour comparer les géométries d’entités et rechercher les entités identiques par emplacement. Les paramètres Tolérance XY et Tolérance Z ne sont valides que si le champ de géométrie est sélectionné en tant que champ en entrée.

Paramètres

ÉtiquetteExplicationType de données
Jeu de données en entrée

Table ou classe d'entités dont les enregistrements identiques sont supprimés.

Table View
Champ(s)

Champ(s) dont les valeurs sont comparées pour rechercher des enregistrements identiques.

Field
Tolérance XY
(Facultatif)

Tolérance x,y qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Linear Unit
Tolérance Z
(Facultatif)

Tolérance z qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Double

Sortie obtenue

ÉtiquetteExplicationType de données
Jeu de données en entrée mis à jour

Jeu de données en entrée mis à jour.

Table View

arcpy.management.DeleteIdentical(in_dataset, fields, {xy_tolerance}, {z_tolerance})
NomExplicationType de données
in_dataset

Table ou classe d'entités dont les enregistrements identiques sont supprimés.

Table View
fields
[fields,...]

Champ(s) dont les valeurs sont comparées pour rechercher des enregistrements identiques.

Field
xy_tolerance
(Facultatif)

Tolérance x,y qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Linear Unit
z_tolerance
(Facultatif)

Tolérance z qui s’applique à chaque sommet lorsqu’il s’agit de déterminer s’il existe un sommet identique dans une autre entité.

Double

Sortie obtenue

NomExplicationType de données
out_dataset

Jeu de données en entrée mis à jour.

Table View

Exemple de code

Exemple 1 d'utilisation de l'outil DeleteIdentical (fenêtre Python)

Le script de fenêtre Python suivant montre comment utiliser la fonction DeleteIdentical en mode intermédiaire.

import arcpy
arcpy.management.DeleteIdentical("C:/data/fireincidents.shp", ["ZONE", "INTENSITY"])
Exemple 2 d'utilisation de l'outil DeleteIdentical (script autonome)

Le script autonome suivant montre comment utiliser la fonction DeleteIdentical pour identifier les enregistrements en double d’une table ou d’une classe d’entités.

# Name: DeleteIdentical_Example2.py
# Description: Delete identical features in a dataset based on Shape (geometry) and a TEXT field.

# Import system modules
import arcpy

arcpy.env.overwriteOutput = True

# Set workspace environment
arcpy.env.workspace = "C:/data/sbfire.gdb"

# Set input feature class
in_dataset = "fireincidents"

# Set the field on which the identical records are found
fields = ["Shape", "INTENSITY"]

# Set the XY tolerance within which identical records will be deleted
xy_tol = "0.02 Miles"

# Set the Z tolerance to default
z_tol = ""

# Run Delete Identical 
arcpy.management.DeleteIdentical(in_dataset, fields, xy_tol, z_tol)