Konzepte des Workspace zum Laden von Daten

Das Werkzeug Workspace zum Laden von Daten erstellen erstellt einen Workspace zum Laden von Daten, eine Datenreferenz-Arbeitsmappe und Zuordnungs-Arbeitsmappen.

Workspace zum Laden von Daten

Der Workspace zum Laden von Daten enthält Ordner, Microsoft Excel-Arbeitsmappen und weitere Elemente, die das Zuordnen von Daten von einem Quellschema zu einem Zielschema unterstützen. Nachfolgend wird die Ordnerstruktur eines Workspace zum Laden von Daten beschrieben.

  • Der Ordner "Data Mapping" enthält je nach Quelldaten die folgenden Ordner:
    • Points: Enthält Arbeitsmappen für jedes der Quellpunkt-Datasets, die zugeordnet wurden.
    • Polygons: Enthält Arbeitsmappen für jedes der Quell-Polygon-Datasets, die zugeordnet wurden.
    • Polylines: Enthält Arbeitsmappen für jedes der Quell-Polylinien-Datasets, die zugeordnet wurden.
    • Table: Enthält Arbeitsmappen für jedes der Quelltabellen-Datasets, die zugeordnet wurden.
    • GlobalLookup: Enthält die GlobalLookup.xlsx-Arbeitsmappe, die zum Erstellen von Lookup-Tabellen für deren Verwendung in allen Zuordnungs-Arbeitsmappen verwendet werden kann.
  • Der Ordner "Scripts" enthält die folgenden Skriptdateien, die Sie zum Verarbeiten von Daten unter Verwendung benutzerdefinierter Funktionen verwenden können. Diese Funktionen können in der Spalte Expression von Zuordnungs-Arbeitsmappen verwendet werden.
    • base.py: Verwenden Sie die Basisfunktionen aus dieser Datei in den Zuordnungs-Arbeitsmappen.
    • shape_operations.py: Verwenden Sie die Funktionen für die Formbearbeitung aus dieser Datei in den Zuordnungs-Arbeitsmappen.
    • user.py: Verwenden Sie diese Datei für benutzerdefinierte Funktionen.
  • Der Ordner "Domains" enthält Arbeitsmappen mit Schemainformationen für alle Domänen im Quell- und Ziel-Workspace.
  • Die Datei DataReference.xlsx enthält die Pfade zu Quell-, Ziel- und Zuordnungs-Arbeitsmappen sowie zu den Einstellungen für das Laden von Daten.

Datenreferenz-Arbeitsmappe

Die Datenreferenz-Arbeitsmappe enthält die Pfade zu Quell-, Ziel- und Zuordnungs-Arbeitsmappen. Wenn sich der Speicherort eines dieser Elemente geändert hat, können Sie die Pfade manuell aktualisieren. Zusätzliche Spalten steuern, wie die Daten aus der Quelle in das Ziel geladen werden, sowie bestimmte Einstellungen für die Geoverarbeitungsumgebung.

Nachfolgend sind die Spaltendefinitionen aufgelistet:

  • Source: Der Speicherort des Quellen-Datasets.
  • SourceDefinitionQuery: Schreiben Sie eine SQL-Abfrage zum Auswählen eines Teils eines Quellen-Datasets, der dem Ziel-Dataset zugeordnet werden soll. Zum Beispiel kann Type = 0 verwendet werden, wenn nur die Datensätze, bei denen der Attributtyp gleich 0 ist, zum Laden in das Ziel-Dataset ausgewählt werden sollen.
  • Target: Der Speicherort des Ziel-Datasets.
  • TargetDeleteQuery: Schreiben Sie eine SQL-Abfrage zum selektiven Löschen von Daten aus dem Ziel-Dataset vor dem Laden. Zum Beispiel werden mit 1=1 alle vorhandenen Daten im Ziel-Dataset entfernt.
  • MappingWorkbook: Der Link zum Speicherort der Datenzuordnungs-Arbeitsmappe im Workspace zum Laden von Daten.
  • Enabled: Der Wert "True" oder "False" gibt an, ob beim Laden der Daten die Datenzuordnungs-Arbeitsmappe verarbeitet oder übersprungen werden soll. Der Standardwert ist "True".
  • MaintainAttachments: Der Wert "True" oder "False" gibt an, ob beim Laden der Daten die Anlagen beibehalten werden sollen. Der Standardwert ist "True".
  • PreserveGlobalIds: Der Wert "True" oder "False" gibt an, ob beim Laden der Daten die Global-IDs beibehalten werden sollen. Die Standardeinstellung ist "False". Global-IDs können beim Laden in einen Service nicht beibehalten werden.
  • GeographicTransformations: Definieren Sie gültige geographische Transformationen, die beim Laden der Daten verwendet werden sollen.

Datenzuordnungs-Arbeitsmappen

Die Datenzuordnungs-Arbeitsmappen befinden sich im Ordner "Data Mapping" und sind nach Geometrietyp organisiert. Jede Datenzuordnungs-Arbeitsmappe entspricht einem der in der Datenreferenz-Arbeitsmappe definierten Paare aus Quelle und Ziel. Verwenden Sie diese Arbeitsmappen, um zu definieren, wie unter Verwendung der nachfolgend beschriebenen Optionen die Daten aus der Quelle dem Ziel zugeordnet werden sollen.

Feldzuordnungs-Arbeitsblatt

Verwenden Sie dieses Arbeitsblatt, um die Feldzuordnung zu definieren. Dieses Arbeitsblatt wird in der Arbeitsmappe grün hervorgehoben.

Nachfolgend sind die Spaltendefinitionen aufgelistet:

  • TargetField: Die Felder aus dem Ziel-Dataset.
  • FieldType: Der Feldtyp eines Feldes im Ziel-Dataset.
  • Expression: Ordnen Sie Felder direkt zu, indem Sie im Dropdown-Menü ein Feld auswählen, oder erstellen Sie einen Python-Ausdruck. Kann zum Beispiel eine externe Python-Funktion oder einen konstanten Wert, wie zum Beispiel eine Zahl oder eine Zeichenfolge, referenzieren.
  • LookupSheet: Geben Sie ein Lookup-Arbeitsblatt an. Muss zusammen mit den Spalten LookupKeys und LookupValue verwendet werden.
  • LookupKeys: Geben Sie mindestens eine Spalte aus dem Lookup-Arbeitsblatt an, die als Schlüssel verwendet werden soll. Wenn mehrere Spalten verwendet werden müssen, trennen Sie sie jeweils durch ein Komma.
  • LookupValue: Geben Sie eine Spalte aus dem Lookup-Arbeitsblatt an, die als Zielwert verwendet werden soll.
  • LookupDefault: Wenn ein Lookup-Arbeitsblatt verwendet wird, kann dieses Feld verwendet werden, um einen Standardwert zu definieren. NULL-Werten und den Werten, die im Arbeitsblatt "Lookup" nicht abgeglichen wurden, wird dieser Wert zugewiesen. Diese Spalte ist optional und kann leer bleiben, wenn kein Standardwert verwendet wird.

Lookup-Arbeitsblatt

Verwenden Sie Lookup-Arbeitsblätter, um die Zuordnung der Werte von Quelle zu Ziel zu definieren. Diese werden im Zuordnungs-Arbeitsblatt als Suchschlüssel und Suchwerte verwendet. Für alle Domänen mit codierten Werten in den Quelldaten wird automatisch ein Blatt mit Spalten, in denen die Codes und Beschreibungen der Domänen enthalten sind, erstellt. Zur Unterstützung einer Suche mit mehreren Werten können manuell zusätzliche Spalten für Felder in den Quelldaten hinzugefügt werden. Diese Arbeitsblätter werden in der Arbeitsmappe blau hervorgehoben.

Wenn der Parameter Optionen für den vorhersagenden Feldabgleich des Werkzeugs Workspace zum Laden von Daten erstellen auf Ähnlichkeit der Beschreibungen von Domänen mit codierten Werten festgelegt wurde, wird automatisch ein Lookup-Arbeitsblatt zwischen Quell- und Zieldomänen generiert. Zuerst werden die Quelldatenspalten und dahinter alle übereinstimmenden Zieldatenspalten hinzugefügt.

Schema-Arbeitsblatt

Verwenden Sie diese Arbeitsblätter, um Schemainformationen über das Quellen- und das Ziel-Dataset anzuzeigen. Diese werden beim Erstellen eines Workspace für die Zuordnung verwendet. Bei der Verarbeitung werden sie nicht verwendet. Diese Arbeitsblätter werden in der Arbeitsmappe gelb hervorgehoben.

Info-Arbeitsblatt

Verwenden Sie dieses Arbeitsblatt, um zusätzlich den Quell-Subtype-Wert zu definieren. Dieses Arbeitsblatt wird in der Arbeitsmappe orange hervorgehoben.

Optionen für die Datenzuordnung

Es gibt mehrere Optionen zum Zuordnen der Daten in den Datenzuordnungs-Arbeitsmappen. Verwendet werden können die Spalten Lookup oder Expression, aber nur eine Methode pro Zielfeld. Überprüfen Sie alle Optionen, um herauszufinden, welche davon für das Laden der Daten am besten geeignet ist. Die nachfolgend beschriebenen Optionen werden im Zuordnungs-Arbeitsblatt konfiguriert.

Ausdruck

Die Spalte Expression kann verwendet werden, um Felder mit kompatiblen Datentypen direkt zuzuordnen. Wenn die Namen bestimmter Quell- und Zielfelder identisch sind, werden sie automatisch abgeglichen. Schauen Sie sich die automatisch abgeglichenen Felder an, um zu überprüfen, ob die Quell- und Zieldatentypen übereinstimmen, und wenn Domänen mit codierten Werten vorhanden sind, ob die Werte einander entsprechen.

Die Spalte Expression kann auch so angepasst werden, dass ein direkt in Excel erstellter Python-Ausdruck verwendet oder eine Funktion im Ordner "Scripts" aufgerufen wird. In den folgenden Szenarien ist dies die beste Option:

  • Konvertieren eines Feldwertes in einen anderen Datentyp
  • Zuordnen aller Quellwerte zu einem Zielwert
  • Erstellen einer GUID (Globally Unique Identifier)
  • Durchführen der Formbearbeitung zum Konvertieren zwischen Geometrietypen