Skip To Content

Datenverarbeitung

ArcGIS Data Pipelines führt eine Batch-Verarbeitung für gespeicherte Vektor- und Tabellendaten wie beispielsweise Daten in einem Feature-Layer oder einem Cloud- oder Objektspeicher wie Amazon S3 und Google BigQuery aus. Data Pipelines bietet Funktionen für Datenvorbereitung und Data Engineering, sodass Sie die Daten verschmelzen, erstellen und in ArcGIS integrieren können. Für die Verarbeitung werden Werkzeuge verwendet, die als Toolsets in den folgenden Kategorien gruppiert sind:

  • Bereinigen: Die Daten bereinigen. Sie können z. B. unnötige Felder löschen. Sie können die Felder auch ändern oder fehlende Werte ergänzen.
  • Konstruieren: Neue Felder aus vorhandenen Feldern oder Eigenschaften des Layers erstellen. Sie können z. B. neue Felder hinzufügen und berechnen, vorhandene Felder standardisieren, transformieren oder reklassifizieren und Felder basierend auf der Geometrie des Eingabe-Layers hinzufügen.
  • Formatieren: Das Format der Felder ändern oder die Felder in der Tabelle oder Feature-Class reorganisieren. Sie können z. B. Zeitfelder konvertieren, kategorische Felder kodieren oder die Dimensionen vorhandener Felder reduzieren.
  • Integrieren: Integrieren oder Hinzufügen von Daten aus einer anderen Datenquelle in die Eingabetabelle oder -Feature-Class. Sie können z. B. Felder verbinden oder Felder hinzufügen, indem Sie die Daten anreichern.
  • Ausgabe-Datasets: Wählen Sie den Ausgabetyp aus, in dem das Ergebnis geschrieben und gespeichert werden soll.

Beispiele

Data Pipelines kann beispielsweise in den folgenden Szenarien verwendet werden:

  • Data Scientists können mit ArcGIS Arcade-Funktionen verschiedenartige Datasets kombinieren und Variablen als Felder berechnen.
  • GIS-Analysten können reproduzierbare Datenvorbereitungs-Workflows erstellen und freigeben.
  • Umweltwissenschaftler können Feldinformationen kombinieren und standardisieren, die als Sammlung von .csv-Dateien gespeichert werden.

Werkzeuge

In den Tabellen der folgenden Abschnitte werden die Werkzeuge in den verschiedenen Kategorien im Data Pipelines-Editor beschrieben.

Bereinigen

Die Kategorie Bereinigen enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Nach Attribut filtern

Das Werkzeug "Nach Attribut filtern" gibt eine Teilmenge eines Datasets basierend auf einer Abfrage zurück. Die Ausgabe ist ein neues Dataset, das nur die Datensätze enthält, die die in der Abfrage angegebene Bedingung erfüllen.

Nach Ausdehnung filtern

Das Werkzeug "Nach Ausdehnung filtern" gibt eine Teilmenge eines Datasets basierend auf einer bestimmten räumlichen Ausdehnung zurück. Die Ausgabe ist ein neues Dataset, das nur die Datensätze enthält, die sich geographisch innerhalb der angegebenen Ausdehnung befinden.

Duplikate entfernen

Das Werkzeug "Duplikate entfernen" entfernt doppelte Datensätze auf der Grundlage von einem oder mehreren Schlüsselfeldern. Die Ausgabe ist ein neues Dataset ohne doppelte Datensätze.

Felder auswählen

Mit dem Werkzeug Felder auswählen können Sie ein oder mehrere angegebene Felder im Ausgabe-Dataset beibehalten. Die Ausgabe ist ein neues Dataset, das nur die angegebenen Felder enthält.

Geometrie vereinfachen

Das Werkzeug "Geometrie vereinfachen" dient zum Vereinfachen der Komplexität von Polylinien oder Polygonen durch Entfernen unnötiger Stützpunkte und Beibehalten nur der wichtigsten Stützpunkte.

Konstruieren

Die Kategorie Konstruieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Feld berechnen

Das Werkzeug Feld berechnen berechnet Feldwerte für ein neues oder ein vorhandenes Feld. Sie können Arcade-Funktionen verwenden, um den Berechnungsausdruck zu definieren.

Datums-/Uhrzeitfeld erstellen

Mit dem Werkzeug "Datums-/Uhrzeitfeld erstellen" wird ein Datums-/Uhrzeitfeld aus vorhandenen Feldwerten erstellt.

Geometrie erstellen

Mit dem Werkzeug "Geometrie erstellen" wird aus einem oder mehreren Feldern ein Geometriefeld erstellt.

Format

Die Kategorie Format enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Felder zuordnen

Mit dem Werkzeug Felder zuordnen wird das Schema eines Datasets transformiert, indem es mit einem Zielschema abgeglichen wird.

Geometrie projizieren

Das Werkzeug "Geometrie projizieren" projiziert ein Geometriefeld in einen neuen Raumbezug.

Verschachtelung des Feldes aufheben

Das Werkzeug Verschachtelung des Feldes aufheben gibt in Feldern des Typs "Array", "Karte" oder "Struct" gespeicherte Werte als neue Felder oder Zeilen zurück.

Felder aktualisieren

Mit dem Werkzeug "Felder aktualisieren" wird der Feldname oder Feldtyp geändert.

Integrieren

Die Kategorie Integrieren enthält die folgenden Werkzeuge:

WerkzeugBeschreibung

Verbinden

Das Werkzeug Verbinden verbindet Datasets auf der Grundlage der angegebenen Beziehungen. Datasets können mithilfe von übereinstimmenden Attributen, räumlichen oder zeitlichen Beziehungen oder einer Kombination dieser drei Aspekte verbunden werden.

Zusammenführen

Das Werkzeug "Zusammenführen" kombiniert zwei oder mehr Datasets zu einem einzelnen neuen Dataset. Sie können Punkt-, Linien-, Polygon- oder Tabellen-Datasets kombinieren.

Ausgabe-Dataset

Die folgenden Ausgabe-Datasets werden unterstützt:

WerkzeugBeschreibung

Feature-Layer

Die Feature-Layer-Ausgabe schreibt Data-Pipeline-Datasets in einen gehosteten Feature-Layer oder eine gehostete Tabelle. Sie können einen Feature-Layer oder eine neue Tabelle erstellen, die Daten in einem vorhandenen Feature-Layer oder einer vorhandenen Tabelle ersetzen oder Datensätze in einem vorhandenen Feature-Layer oder einer vorhandenen Tabelle hinzufügen und aktualisieren.


In diesem Thema
  1. Beispiele
  2. Werkzeuge