ArcGIS Velocity erfasst mithilfe von Feeds oder Datenquellen Daten in Echtzeit- und Big-Data-Analysen. Ein Feed ist ein Echtzeit-Datenstrom; eine Datenquelle lädt statische Daten oder echtzeitnahe Daten beim Starten der Echtzeitanalyse, wodurch sie für schnelle Verbindungen, die Anreicherung und das Geofencing zur Verfügung gestellt werden.
Ein Feed sollte verwendet werden, um Echtzeitdaten zu nutzen, oder als Verbindungsdaten für Analysewerkzeuge in Echtzeitanalysen.
Velocity bietet einen optimierten und kontextbezogenen Workflow zum Verbessern der User Experience beim Konfigurieren von Eingabedaten eines Feeds oder einer Datenquelle. Dieser Konfigurations-Workflow gilt für verschiedene Typen von Feeds und Datenquellen.
Festlegen von Verbindungs- und Konfigurationsparametern
Der erste Schritt beim Konfigurieren eines Feeds oder einer Datenquelle ist das Definieren der erforderlichen Verbindungs- und Konfigurationsparameter, damit Velocity mit den Daten verbunden werden kann. Welche Parameter verfügbar sind, hängt vom Feed- oder Datenquellentyp ab.
Wenn Sie beispielsweise einen Kafka-Feed konfigurieren, geben Sie die Parameter Broker und Topic ein, um eine Verbindung mit den Daten herzustellen. Beim Konfigurieren einer Amazon S3-Datenquelle müssen Sie alle relevanten Verbindungsparameter angeben, um erfolgreich eine Verbindung herzustellen.
Als Nächstes überprüft Velocity die Verbindung anhand der angegebenen Konfigurationsparameter. Dann versucht Velocity, die Daten abzufragen und das Schema der Daten abzuleiten. Wenn das Herstellen der Verbindung fehlgeschlagen ist und die Daten nicht erfolgreich abgeleitet wurden, aktualisieren Sie die Konfigurationsparameter entsprechend, und versuchen Sie es erneut.
Bestätigen des Schemas
Im Schritt Schema bestätigen werden das zurückgegebene Schema sowie eine Daten-Stichprobe angezeigt. Abhängig vom Datenformat stehen mehr Parameter zur Verfügung, mit denen die Datenanalyse an ein gültiges Schema angepasst werden kann.
In diesem Schritt können Sie die Feldnamen, Feldtypen und Datenformate überprüfen und anpassen. Sie können außerdem die Daten erneut ableiten, um neue Stichproben zu erhalten, oder das Schema ableiten, nachdem Anpassungen am Datenformat oder dessen Parametern vorgenommen wurden. Dies stellt sicher, dass Velocity das Format der vom Feed oder der Datenquelle erfassten Daten identifizieren kann.
Automatische Stichproben und Ableitung des Schemas
Im Schritt Schema bestätigen stellt Velocity unter Verwendung der Verbindungs- und Konfigurationsparameter, die Sie im vorherigen Schritt festgelegt haben, eine Verbindung mit dem angegebenen Feed oder der angegebenen Datenquelle her und ruft Stichprobendaten ab.
Velocity leitet aus den Stichprobendaten automatisch das Datenformat und Schema der Feldnamen und -typen ab. Für einige Datenformate werden auch Schlüsselfelder für Geometrie und Datum/Uhrzeit identifiziert.
Ändern von Feldtypen und Feldnamen
In Velocity werden die Feldtypen und Feldnamen angezeigt, die durch die Schemaableitung auf Grundlage der abgerufenen Datenstichprobe identifiziert wurden.
Um Anpassungen am abgeleiteten Schema vorzunehmen, führen Sie die folgenden Schritte aus:
- Ändern Sie die Datenformatparameter und führen Sie ein Resampling des Schemas durch, bevor Sie die Feldtypen und Feldnamen anpassen.
Wenn das Datenformat oder dessen Parameter geändert wurden und eine Ableitung des Schemas erforderlich ist, werden alle von Ihnen vorgenommenen Änderungen überschrieben.
- Um einen Feldtyp zu ändern, klicken Sie auf den Dropdown-Pfeil neben dem Feldnamen und wählen einen anderen Feldtyp aus.
Sie können Feldtypen nicht ändern, wenn Sie bestimmte Feed- oder Datenquellentypen, z. B. Feature-Layer-Feeds oder -Datenquellen, verwenden. Aus folgenden Gründen müssen Sie beim Ändern des Feldtyps vorsichtig vorgehen:
- Jeder Feldtyp kann in ein Feld vom Typ "Zeichenfolge" geändert werden; wenn Sie jedoch versuchen, ein Feld vom Typ "Zeichenfolge", das Buchstaben enthält, in ein Feld vom Typ "Integer" zu ändern, tritt während der Datenerfassung ein Fehler auf.
- Das Ändern von Feldern, die vom Typ Float (Float32 oder Float64) sind, in einen Integer-Typ (Int32 oder Int64) wird nicht empfohlen. Das Ändern von Feldtypen ist nicht für die On-the-fly-Konvertierung numerischer Werte vorgesehen. Bei einigen Formaten kann das Herabstufen von Float auf Integer dazu führen, dass der Wert übersprungen wird.
- Ändern Sie die Feldnamen nach Bedarf.
- Um ein Feld zu deaktivieren, deaktivieren Sie das Kontrollkästchen neben dem Feldtyp.
Das Feld wird ignoriert, wenn Daten aus der Quelle erfasst werden. Für eine gute Performance im Hinblick auf Geschwindigkeit und Volumen empfiehlt es sich, alle nicht erforderlichen Felder zu deaktivieren.
Ändern des Datenformats und der Datenformatparameter
Velocity kann Daten aus verschiedenen Feed- und Datenquellentypen in zahlreichen Datenformaten verwenden. Für manche Feed- und Datenquellentypen, z. B. HTTP-Poller, können Daten in verschiedenen Formaten verwendet werden. Andere Feed- und Datenquellentypen, z. B. Feature-Layer, weisen ein festes Datenformat auf.
Die folgenden Datenformate werden unterstützt:
- Durch Trennzeichen getrennt
- JSON
- GeoJSON
- Esri JSON
- RSS
- GeoRSS
- Shapefile (nur verfügbar für Amazon S3- und Azure Blob Store-Datenquellen)
- Parquet (nur verfügbar für Amazon S3- und Azure Blob Store-Datenquellen)
Velocity versucht automatisch, das Format der Daten abzuleiten, Sie können das abgeleitete Datenformat jedoch ggf. ändern.
Für manche Datenformate sind zudem Parameter verfügbar, mit denen Sie anpassen können, wie Velocity das Schema anhand der Analyse der Daten bestimmt. Das durch Trennzeichen getrennte Datenformat hat beispielsweise zwei Parameter, das Feldtrennzeichen und die Kopfzeile.
Ändern von Datenformatparametern und Ableiten des Schemas
Velocity versucht anhand der abgeleiteten Datenstichprobe, das Format, das Schema und die Parameter der Daten zu definieren.
Sie können die Datenformatparameter ändern und ein anderes Datenformat festlegen. Ändern Sie zu diesem Zweck einfach die Datenformateigenschaft und klicken Sie auf Schema ableiten, um die Daten erneut entsprechend den von Ihnen durchgeführten Änderungen abzuleiten. Die Parameter werden basierend auf den abgeleiteten Daten aktualisiert.
Wenn Sie z. B. eine Verbindung mit einer JSON-Quelle mit auf mehreren Ebenen geschachteltem JSON herstellen, Daten aus einem bestimmten JSON-Knoten erfassen oder die Anzahl der Ebenen von JSON-Code verringern möchten, um alle Attribute abzurufen, können Sie mit den Parametern root node und flatten die Interaktion von Velocity mit den JSON-Daten direkt konfigurieren.
Stichprobendaten werden nicht zurückgegeben
Wenn in Velocity keine Stichprobendaten zurückgegeben werden, verwenden Sie eine der folgenden Lösungsmöglichkeiten:
- Überprüfen Sie, ob die Verbindungs- und Konfigurationsparameter korrekt sind.
- Klicken Sie auf Schema ableiten, um ein Resampling durchzuführen, wenn Daten übertragen werden oder verfügbar sind.
- Stellen Sie eigene Stichproben bereit, indem Sie Datensätze kopieren.
Im Hinblick auf das Datenformat und zum Ableiten eines gültigen Schemas können Sie sich entsprechende Beispiele anschauen.
- Definieren Sie das Format und Schema der Daten manuell.
Identifizieren der Schlüsselfelder
Der nächste Schritt beim Konfigurieren der Eingabedaten für den neuen Feed oder die neue Datenquelle ist das Identifizieren von Schlüsselfeldern. Schlüsselfelder dienen zum Analysieren der Feature-Geometrie anhand von Feldern, zum Erstellen von Datumsangaben aus Zeichenfolgen, zum Angeben von Feldern für die Start- und Endzeit und zum Festlegen eines Feldes als Track-ID.
Position
Für viele Feed- und Datenquellentypen müssen Sie festlegen, wie Velocity die Geometrie von Features aus Beobachtungen oder Datensätzen bestimmt. Die Geometrie kann mit einem einzelnen Geometriefeld oder mit X-/Y-Feldern definiert werden. Alternativ können Sie Tabellendaten ohne Positionsinformationen laden und keine Geometriefelder angeben.
Weitere Informationen zum Konfigurieren der Positionsparameter
Datum und Uhrzeit
Zu den Features in einem Feed oder in einer Datenquelle sind möglicherweise Uhrzeitfelder verfügbar. Wenn Sie festlegen, dass die Daten Datumsfelder aufweisen, müssen Sie auch das Datumsformat festlegen. Die Optionen lauten Epoch-Werte und Andere (Zeichenfolge). Wenn Sie Andere (Zeichenfolge) auswählen, müssen Sie den Wert Datums-Formatierungszeichenfolge angeben, damit Velocity die Zeichenfolge als Datum auswerten kann.
Optional können Sie ein Schlüsselfeld für die Option Startzeit auswählen. Zum Analysieren und Verarbeiten der Daten müssen Sie keine Startzeit oder Endzeit festlegen. Einige Werkzeuge für die Echtzeit- und Big-Data-Analyse erfordern jedoch zum Ausführen von zeitlichen Analysen die Angabe einer Startzeit oder einer Startzeit und Endzeit.
Weitere Informationen zu den Parametern für Datum und Uhrzeit
Tracking
Das Schlüsselfeld, das für die Option Track-ID festgelegt wird, ist eine eindeutige Kennung in den Daten, die Features mit bestimmten Entitäten in Beziehung setzt. So wird ein Lkw beispielsweise durch sein Nummernschild und ein Flugzeug durch die ihm zugewiesene Flugnummer identifiziert. Diese Kennungen können als Track-IDs zum Verfolgen der Features einer bestimmten realen Entität oder einer Gruppe von Ereignissen verwendet werden.
Zum Analysieren und Verarbeiten der Daten müssen Sie kein Track-ID-Feld festlegen. Einige Werkzeuge für die Echtzeit- und Big-Data-Analyse erfordern jedoch die Angabe einer Track-ID im Feed oder in der Datenquelle.
Planen des Abfrageintervalls
Auch wenn viele Feeds Daten streamen, ist es bei einigen Feed-Typen erforderlich, dass die Daten in regelmäßigen Intervallen abgerufen werden. Das festgelegte Intervall bestimmt, wie oft der Feed Daten von der Quelle abruft: Sie können ein Abfrageintervall für die folgenden Feed-Typen festlegen:
Weitere Informatioinen über das Planen des Feed-Abfrageintervalls
Speichern
Der letzte Schritt besteht darin, einen Feed-Namen und auf Wunsch eine Feed-Zusammenfassung anzugeben und den Feed dann zu speichern.