Konfigurieren von Eingabedaten

ArcGIS Velocity erfasst mithilfe von Feeds oder Datenquellen Daten in Echtzeit- und Big-Data-Analysen. Ein Feed ist ein Echtzeit-Datenstrom; eine Datenquelle lädt statische Daten oder echtzeitnahe Daten. Weitere Informationen finden Sie unter Arbeiten mit Feeds? und Arbeiten mit Datenquellen?

Velocity bietet einen optimierten und kontextbezogenen Workflow zum Verbessern der Benutzerfreundlichkeit beim Konfigurieren von Eingabedaten eines Feeds oder einer Datenquelle. Dieser Konfigurations-Workflow gilt für verschiedene Typen von Feeds und Datenquellen.

Festlegen von Verbindungs- und Konfigurationsparametern

Der erste Schritt beim Konfigurieren eines Feeds oder einer Datenquelle ist das Definieren der erforderlichen Verbindungs- und Konfigurationsparameter, damit Velocity mit den Daten verbunden werden kann. Welche Parameter verfügbar sind, hängt vom Feed- oder Datenquellentyp ab.

Wenn Sie beispielsweise einen Kafka-Feed konfigurieren, geben Sie die Parameter Broker und Topic ein, um eine Verbindung mit den Daten herzustellen. Beim Konfigurieren einer Amazon S3-Datenquelle müssen Sie alle relevanten Verbindungsparameter angeben, um erfolgreich eine Verbindung herzustellen.

Konfigurationsparameter in

Als Nächstes überprüft Velocity die Verbindung anhand der angegebenen Konfigurationsparameter. Dann versucht Velocity, die Daten abzufragen und das Schema der Daten abzuleiten. Wenn das Herstellen der Verbindung fehlgeschlagen ist und die Daten nicht erfolgreich abgeleitet wurden, aktualisieren Sie die Konfigurationsparameter entsprechend, und versuchen Sie es erneut.

Bestätigen des Schemas

Im Schritt Schema bestätigen werden das zurückgegebene Schema sowie eine Stichprobe der Daten angezeigt. Abhängig vom Datenformat stehen zusätzliche Parameter zur Verfügung, mit denen die Datenanalyse an ein gültiges Schema angepasst werden kann.

Im Schritt Schema bestätigen können Sie die Feldnamen, Feldtypen und Datenformate überprüfen und anpassen. Sie können außerdem die Daten erneut ableiten, um neue Stichproben zu erhalten, oder das Schema ableiten, nachdem Anpassungen am Datenformat oder dessen Parametern vorgenommen wurden. Dies stellt sicher, dass Velocity das Format der vom Feed oder der Datenquelle erfassten Daten identifizieren kann.

HTTP-Poller-Schritt "Schema bestätigen"

Automatische Stichproben und Ableitung des Schemas

Im Schritt Schema bestätigen stellt Velocity unter Verwendung der Verbindungs- und Konfigurationsparameter, die Sie im vorherigen Schritt festgelegt haben, eine Verbindung mit dem angegebenen Feed oder der angegebenen Datenquelle her und ruft Stichprobendaten ab.

Velocity leitet aus den Stichprobendaten automatisch das Datenformat und Schema der Feldnamen und -typen ab. Für einige Datenformate werden auch Schlüsselfelder für Geometrie und Datum/Uhrzeit identifiziert.

Ändern von Feldtypen und Feldnamen

In Velocity werden die Feldtypen und Feldnamen angezeigt, die durch die Schemaableitung auf Grundlage der abgerufenen Datenstichprobe identifiziert wurden.

Sie können die folgenden Anpassungen an dem abgeleiteten Schema vornehmen:

  • Ändern von Feldtypen
    • Verwenden Sie den Dropdown-Pfeil neben dem Feldnamen, um den Feldtyp zu ändern.
    • Sie können Feldtypen nicht ändern, wenn Sie bestimmte Feed- oder Datenquellentypen, z. B. Feature-Layer-Feeds oder -Datenquellen, verwenden.
    • Aus folgenden Gründen müssen Sie beim Ändern des Feldtyps vorsichtig vorgehen:
      • Jeder Feldtyp kann in ein Feld vom Typ "Zeichenfolge" geändert werden; wenn Sie jedoch versuchen, ein Feld vom Typ "Zeichenfolge", das Buchstaben enthält, in ein Feld vom Typ "Integer" zu ändern, tritt während der Datenerfassung ein Fehler auf.
      • Das Ändern von Feldern, die vom Typ Float (Float32 oder Float64) sind, in einen Integer-Typ (Int32 oder Int64) wird nicht empfohlen. Das Ändern von Feldtypen ist nicht für die On-the-fly-Konvertierung numerischer Werte vorgesehen. Bei einigen Formaten kann das Herabstufen von Float auf Integer dazu führen, dass der Wert übersprungen wird.
  • Ändern von Feldnamen
    • Ändern Sie die Feldnamen nach Bedarf.
  • Deaktivieren von Feldern
    • Um ein Feld zu deaktivieren, deaktivieren Sie das Kontrollkästchen neben dem Feldtyp. Das Feld wird ignoriert, wenn Daten aus der Quelle erfasst werden.
    • Für eine gute Performance im Hinblick auf Geschwindigkeit und Volumen empfiehlt es sich, alle nicht erforderlichen Felder zu deaktivieren.

Hinweis:

Ändern Sie die Datenformatparameter und führen Sie ein Resampling des Schemas durch, bevor Sie die Feldtypen und Feldnamen anpassen. Wenn das Datenformat oder Datenformatparameter geändert wurden und eine Schemaableitung erforderlich ist, werden alle von Ihnen vorgenommenen Änderungen überschrieben.

Ändern des Datenformats und der Datenformatparameter

Velocity kann Daten aus verschiedenen Feed- und Datenquellentypen in zahlreichen Datenformaten verwenden. Für manche Feed- und Datenquellentypen, z. B. Website (Abfrage), können Daten in verschiedenen Formaten verwendet werden. Andere Feed- und Datenquellentypen, z. B. Feature-Layer, weisen ein festes Datenformat auf.

Die folgenden Datenformate werden unterstützt:

  • Durch Trennzeichen getrennt
  • JSON
  • GeoJSON
  • EsriJSON
  • RSS
  • GeoRSS
  • Shapefile (nur Big-Data-Analysen)
  • Parquet (nur Big-Data-Analysen)

Velocity versucht automatisch, das Format der Daten abzuleiten, Sie können das abgeleitete Datenformat jedoch ggf. ändern.

Für manche Datenformate sind zudem Parameter verfügbar, mit denen Sie anpassen können, wie Velocity das Schema anhand der Analyse der Daten bestimmt. Das durch Trennzeichen getrennte Datenformat hat beispielsweise zwei Parameter, das Feldtrennzeichen und die Kopfzeile.

Informationen zu den verschiedenen Datenformaten und den zugehörigen Parametern finden Sie unter Unterstützte Datenformate.

Ändern von Datenformatparametern und Ableiten des Schemas

Velocity versucht anhand der abgeleiteten Datenstichprobe, das Format, das Schema und die Parameter der Daten zu definieren.

Sie können die Datenformatparameter ändern und ein anderes Datenformat festlegen. Ändern Sie zu diesem Zweck einfach die Datenformateigenschaft und klicken Sie auf Schema ableiten, um die Daten erneut entsprechend den von Ihnen durchgeführten Änderungen abzuleiten. Die Parameter werden basierend auf den abgeleiteten Daten aktualisiert.

Wenn Sie z. B. eine Verbindung mit einer JSON-Quelle mit auf mehreren Ebenen geschachteltem JSON herstellen, Daten aus einem bestimmten JSON-Knoten erfassen oder die Anzahl der Ebenen von JSON-Code verringern möchten, um alle Attribute abzurufen, können Sie mit den Parametern root node und flatten die Interaktion von Velocity mit den JSON-Daten direkt konfigurieren.

Stichprobendaten werden nicht zurückgegeben

Wenn in Velocity keine Stichprobendaten zurückgegeben werden, verwenden Sie eine der folgenden Lösungsmöglichkeiten:

  • Überprüfen Sie, ob die Verbindungs- und Konfigurationsparameter korrekt sind.
  • Klicken Sie auf Schema ableiten, um ein Resampling durchzuführen, wenn Daten übertragen werden oder verfügbar sind.
  • Stellen Sie eigene Stichproben bereit, indem Sie Datensätze kopieren. Im Hinblick auf das Datenformat und zum Ableiten eines gültigen Schemas können Sie sich entsprechende Beispiele anschauen.
  • Definieren Sie das Format und Schema der Daten manuell.

Identifizieren der Schlüsselfelder

Der nächste Schritt beim Konfigurieren der Eingabedaten für den neuen Feed oder die neue Datenquelle ist das Identifizieren von Schlüsselfeldern. Schlüsselfelder dienen zum Analysieren der Feature-Geometrie anhand von Feldern, zum Erstellen von Datumsangaben aus Zeichenfolgen, zum Angeben von Feldern für die Start- und Endzeit und zum Festlegen eines Feldes als Track-ID.

Position

Für viele Feed- und Datenquellentypen müssen Sie festlegen, wie Velocity die Geometrie von Features aus Beobachtungen oder Datensätzen bestimmt. Die Geometrie kann mit einem einzelnen Geometriefeld oder mit X-/Y-Feldern definiert werden. Alternativ können Sie Tabellendaten ohne Positionsinformationen laden und keine Geometriefelder angeben.

Details zum Konfigurieren der Positionsparameter finden Sie unter Positionsparameter.

Datum und Uhrzeit

Zu den Features in einem Feed oder in einer Datenquelle sind möglicherweise Uhrzeitfelder verfügbar. Wenn Sie festlegen, dass die Daten Datumsfelder aufweisen, müssen Sie möglicherweise auch das Datumsformat festlegen. Die beiden Optionen lauten Epoch-Werte und Andere (Zeichenfolge). Wenn Sie Andere (Zeichenfolge) auswählen, müssen Sie den Wert Datums-Formatierungszeichenfolge angeben, damit Velocity die Zeichenfolge als Datum auswerten kann.

Darüber hinaus können Sie den Schlüsselfeldwert Startzeit auswählen. Zum Analysieren und Verarbeiten der Daten müssen Sie keine Startzeit oder Endzeit festlegen. Einige Werkzeuge für die Echtzeit- und Big-Data-Analyse erfordern jedoch zum Ausführen von zeitlichen Analysen die Angabe einer Startzeit oder einer Startzeit und Endzeit.

Informationen zur Konfiguration der Datums- und Uhrzeitparameter finden Sie unter Datums- und Uhrzeitparameter.

Tracking

Das Schlüsselfeld Track-ID ist eine eindeutige Kennung in den Daten, die Features mit bestimmten Entitäten in Beziehung setzt. So wird ein Lkw beispielsweise durch sein Nummernschild und ein Flugzeug durch die ihm zugewiesene Flugnummer identifiziert. Diese Kennungen können als Track-IDs zum Verfolgen der Features einer bestimmten realen Entität oder einer Gruppe von Ereignissen verwendet werden.

Zum Analysieren und Verarbeiten der Daten müssen Sie kein Track-ID-Feld festlegen. Einige Werkzeuge für die Echtzeit- und Big-Data-Analyse erfordern jedoch die Angabe einer Track-ID im Feed oder in der Datenquelle.

Planen des Abfrageintervalls

Auch wenn viele Feeds Daten streamen, ist es bei einigen Feed-Typen erforderlich, dass die Daten in regelmäßigen Intervallen abgerufen werden. Das festgelegte Intervall bestimmt, wie oft der Feed Daten von der Quelle abruft: Sie können ein Abfrageintervall für die folgenden Feed-Typen festlegen:

Informationen zur Konfiguration und Überlegungen zum Abfrageintervall von Feeds finden Sie unter Planen des Abfrageintervalls.

Speichern

Der letzte Schritt besteht darin, einen Feed-Namen und auf Wunsch eine Feed-Zusammenfassung anzugeben und den Feed dann zu speichern.