Konfigurieren von Eingabedaten—ArcGIS Velocity

ArcGIS Velocity erfasst mithilfe von Feeds oder Datenquellen Daten in Echtzeit- und Big-Data-Analysen. Ein Feed ist ein Echtzeit-Datenstrom, der aus einer Datenquelle stammt, die statische Daten oder echtzeitnahe Daten beim Starten der Echtzeitanalyse lädt, wodurch sie für schnelle Verbindungen, die Anreicherung und das Geofencing zur Verfügung gestellt werden.

Sie können einen Feed zur Nutzung von Echtzeitdaten, oder als Verbindungsdaten für Analysewerkzeuge in Echtzeitanalysen verwenden.

Velocity bietet einen optimierten und kontextbezogenen Workflow zum Verbessern der User Experience beim Konfigurieren von Eingabedaten eines Feeds oder einer Datenquelle. Dieser Konfigurations-Workflow gilt für verschiedene Typen von Feeds und Datenquellen.

Festlegen von Verbindungs- und Konfigurationsparametern

Der erste Schritt beim Konfigurieren eines Feeds oder einer Datenquelle ist das Definieren der erforderlichen Verbindungs- und Konfigurationsparameter, damit Velocity mit den Daten verbunden werden kann. Welche Parameter verfügbar sind, hängt vom Feed- oder Datenquellentyp ab.

Wenn Sie beispielsweise einen Kafka-Feed konfigurieren, geben Sie die Parameter Broker und Topic ein, um eine Verbindung mit den Daten herzustellen. Beim Konfigurieren einer Amazon S3-Datenquelle müssen Sie alle relevanten Verbindungsparameter angeben, um erfolgreich eine Verbindung herzustellen.

Als Nächstes überprüft Velocity die Verbindung anhand der angegebenen Konfigurationsparameter. Dann versucht Velocity, die Daten abzufragen und das Schema der Daten abzuleiten. Wenn das Herstellen der Verbindung fehlgeschlagen ist und das Schema nicht erfolgreich abgeleitet wurde, aktualisieren Sie die Konfigurationsparameter entsprechend, und versuchen Sie es erneut.

Bestätigen des Schemas

Im Schritt Schema bestätigen werden das zurückgegebene Schema sowie eine Daten-Stichprobe angezeigt. Abhängig vom Datenformat stehen mehr Parameter zur Verfügung, mit denen die Datenanalyse an ein gültiges Schema angepasst werden kann.

In diesem Schritt können Sie die Feldnamen, Feldtypen und Datenformate überprüfen und anpassen. Sie können außerdem die Daten erneut ableiten, um neue Stichproben zu erhalten, oder das Schema ableiten, nachdem Anpassungen am Datenformat oder dessen Parametern vorgenommen wurden. Dies stellt sicher, dass Velocity das Format der vom Feed oder der Datenquelle erfassten Daten identifizieren kann.

Automatische Stichproben und Ableitung des Schemas

Im Schritt Schema bestätigen stellt Velocity unter Verwendung der Verbindungs- und Konfigurationsparameter, die im vorherigen Schritt festgelegt wurden, eine Verbindung mit dem angegebenen Feed oder der angegebenen Datenquelle her und ruft Stichprobendaten ab.

Velocity leitet aus den Stichprobendaten automatisch das Datenformat und Schema der Feldnamen und -typen ab. Für einige Datenformate werden auch die Geometrie und die Schlüsselfelder für Datum und Uhrzeit identifiziert.

Ändern von Feldtypen und Feldnamen

In Velocity werden die Feldtypen und Feldnamen angezeigt, die durch die Schemaableitung auf Grundlage der abgerufenen Datenstichprobe identifiziert wurden.

Um Anpassungen am abgeleiteten Schema vorzunehmen, führen Sie die folgenden Schritte aus:

Ändern Sie die Datenformatparameter und führen Sie ein Resampling des Schemas durch, bevor Sie die Feldtypen und Feldnamen anpassen.
Wenn das Datenformat oder dessen Parameter geändert wurden und eine Ableitung des Schemas erforderlich ist, werden alle vorgenommenen Änderungen überschrieben.
Um einen Feldtyp zu ändern, klicken Sie auf den Dropdown-Pfeil neben dem Feldnamen und wählen einen anderen Feldtyp aus.
Vorsicht:
Sie können Feldtypen nicht ändern, wenn Sie bestimmte Feed- oder Datenquellentypen, z. B. Feature-Layer-Feeds oder -Datenquellen, verwenden. Gehen Sie beim Ändern des Feldtyps vorsichtig vor. Bedenken Sie Folgendes:
- Jeder Feldtyp kann in ein Feld vom Typ "Zeichenfolge" geändert werden; wenn Sie jedoch versuchen, ein Feld vom Typ "Zeichenfolge", das Buchstaben enthält, in ein Feld vom Typ "Integer" zu ändern, tritt während der Datenerfassung ein Fehler auf.
- Das Ändern von Feldern, die vom Typ Float (Float32 oder Float64) sind, in einen Integer-Typ (Int32 oder Int64) wird nicht empfohlen. Das Ändern von Feldtypen ist nicht für die On-the-fly-Konvertierung numerischer Werte vorgesehen. Bei einigen Formaten kann das Herabstufen von Float auf Integer dazu führen, dass der Wert übersprungen wird.
Ändern Sie die Feldnamen nach Bedarf.
Um ein Feld zu deaktivieren, deaktivieren Sie das Kontrollkästchen neben dem Feldtyp.
Das Feld wird ignoriert, wenn Daten aus der Quelle erfasst werden. Für eine gute Performance im Hinblick auf Geschwindigkeit und Volumen empfiehlt es sich, alle nicht erforderlichen Felder zu deaktivieren.

Ändern des Datenformats und der Datenformatparameter

Velocity kann Daten aus verschiedenen Feed- und Datenquellentypen in zahlreichen Datenformaten verwenden. Für manche Feed- und Datenquellentypen, z. B. HTTP-Poller, können Daten in verschiedenen Formaten verwendet werden. Andere Feed- und Datenquellentypen, z. B. Feature-Layer, weisen ein festes Datenformat auf.

Die folgenden Datenformate werden unterstützt:

Durch Trennzeichen getrennt
JSON
GeoJSON
Esri JSON
RSS
GeoRSS
Shapefile (nur verfügbar für Amazon S3- und Azure Blob Store-Datenquellen)
Parquet (nur verfügbar für Amazon S3- und Azure Blob Store-Datenquellen)

Velocity versucht automatisch, das Format der Daten abzuleiten, Sie können das abgeleitete Datenformat jedoch ggf. ändern.

Für manche Datenformate sind zudem Parameter verfügbar, mit denen Sie anpassen können, wie Velocity das Schema anhand der Analyse der Daten bestimmt. Das durch Trennzeichen getrennte Datenformat hat beispielsweise zwei Parameter, das Feldtrennzeichen und die Kopfzeile.

Weitere Informationen zu unterstützten Datenformaten

Ändern von Datenformatparametern und Ableiten des Schemas

Velocity versucht anhand der abgeleiteten Datenstichprobe, das Format, das Schema und die Parameter der Daten zu definieren.

Sie können die Datenformatparameter ändern und ein anderes Datenformat festlegen. Ändern Sie zu diesem Zweck einfach die Datenformateigenschaft und klicken Sie auf Schema ableiten, um die Daten erneut entsprechend den von Ihnen durchgeführten Änderungen abzuleiten. Die Parameter werden basierend auf den abgeleiteten Daten aktualisiert.

Wenn Sie z. B. eine Verbindung mit einer JSON-Quelle mit auf mehreren Ebenen geschachteltem JSON herstellen, Daten aus einem bestimmten JSON-Knoten erfassen oder die Anzahl der Ebenen von JSON-Code verringern möchten, um alle Attribute abzurufen, können Sie mit den Parametern root node und flatten die Interaktion von Velocity mit den JSON-Daten direkt konfigurieren.

Stichprobendaten werden nicht zurückgegeben

Wenn in Velocity keine Stichprobendaten zurückgegeben werden, verwenden Sie eine der folgenden Lösungsmöglichkeiten:

Überprüfen Sie, ob die Verbindungs- und Konfigurationsparameter korrekt sind.
Klicken Sie auf Schema ableiten, um ein Resampling durchzuführen, wenn Daten übertragen werden oder verfügbar sind.
Stellen Sie Stichproben bereit, indem Sie Datensätze kopieren.
Im Hinblick auf das Datenformat und zum Ableiten eines gültigen Schemas können Sie sich entsprechende Beispiele anschauen.
Definieren Sie das Format und Schema der Daten manuell.

Schlüsselfelder identifizieren

Der nächste Schritt beim Konfigurieren der Eingabedaten für den neuen Feed oder die neue Datenquelle ist das Identifizieren von Schlüsselfeldern. Schlüsselfelder dienen zum Analysieren der Feature-Geometrie anhand von Feldern, zum Erstellen von Datumsangaben aus Zeichenfolgen, zum Angeben von Feldern für die Start- und Endzeit und zum Festlegen eines Feldes als Track-ID.

Position

Für viele Feed- und Datenquellentypen müssen Sie festlegen, wie Velocity die Geometrie von Features aus Beobachtungen oder Datensätzen bestimmt. Die Geometrie kann mit einem einzelnen Geometriefeld oder mit X-/Y-Feldern definiert werden. Alternativ können Sie Tabellendaten ohne Positionsinformationen laden und keine Geometriefelder angeben.

Weitere Informationen zum Konfigurieren der Positionsparameter

Datum und Uhrzeit

Zu den Features in einem Feed oder in einer Datenquelle sind möglicherweise Uhrzeitfelder verfügbar. Wenn Sie festlegen, dass die Daten Datumsfelder aufweisen, müssen Sie auch das Datumsformat festlegen. Die Optionen lauten Epoch-Werte und Andere (Zeichenfolge). Wenn Sie Andere (Zeichenfolge) auswählen, müssen Sie den Wert Datums-Formatierungszeichenfolge angeben, damit Velocity die Zeichenfolge als Datum auswerten kann.

Optional können Sie ein Schlüsselfeld für die Option Startzeit auswählen. Zum Analysieren und Verarbeiten der Daten müssen Sie keine Startzeit oder Endzeit festlegen. Einige Werkzeuge für die Echtzeit- und Big-Data-Analyse erfordern jedoch zum Ausführen von zeitlichen Analysen die Angabe einer Startzeit oder einer Startzeit und Endzeit.

Weitere Informationen zu den Parametern für Datum und Uhrzeit

Tracking

Das Schlüsselfeld, das für die Option Track-ID festgelegt wird, ist eine eindeutige Kennung in den Daten, die Features mit bestimmten Entitäten in Beziehung setzt. So wird ein Lkw beispielsweise durch sein Nummernschild und ein Flugzeug durch die ihm zugewiesene Flugnummer identifiziert. Diese Kennungen können als Track-IDs zum Verfolgen der Features einer bestimmten realen Entität oder einer Gruppe von Ereignissen verwendet werden.

Zum Analysieren und Verarbeiten der Daten müssen Sie kein Track-ID-Feld festlegen. Einige Werkzeuge für die Echtzeit- und Big-Data-Analyse erfordern jedoch die Angabe einer Track-ID im Feed oder in der Datenquelle.

Planen des Abfrageintervalls

Auch wenn viele Feeds Daten streamen, ist es bei einigen Feed-Typen erforderlich, dass die Daten in regelmäßigen Intervallen abgerufen werden. Das festgelegte Intervall bestimmt, wie oft der Feed Daten von der Quelle abruft: Sie können ein Abfrageintervall für die folgenden Feed-Typen festlegen:

Weitere Informatioinen über das Planen des Feed-Abfrageintervalls

Hinweis:

Beim Einrichten der Velocity-Feeds kann der Wiederholungswert für Sekunden auf einen Faktor von 60 (zwischen 10 und 30) festgelegt werden, um eine konsistente und vorhersehbare Laufzeit zu gewährleisten.

Speichern

Der letzte Schritt besteht darin, einen Feed-Namen und auf Wunsch eine Feed-Zusammenfassung anzugeben und den Feed dann zu speichern.

Feedback zu diesem Thema?