Die Schritte in dieser Lektion beschreiben das Erstellen einer Big-Data-Analyse mit ArcGIS Velocity. In diesem Beispiel wird die Rolle eines Verkehrsplaners übernommen, der Kfz-Unfälle mit Radfahrern über einen Zeitraum von mehreren Jahren untersuchen möchte. Mithilfe der Ergebnisse soll ermittelt werden, wo sich durch die Entwicklung einer neuen fahrradfreundlichen Infrastruktur, z. B. Radwege oder Radwegabgrenzungen, die größte Wirkung für die Sicherheit der Radfahrer erzielen lässt.
Bei der Durchführung der Schritte erstellen Sie eine Big-Data-Analyse, konfigurieren eine Datenquelle sowie Werkzeuge und generieren einen Ausgabe-Feature-Layer, der Analyseergebnisse enthält, die in einer Webkarte angezeigt werden können.
Diese Lektion ist für Einsteiger konzipiert. Sie benötigen ein ArcGIS Online-Konto mit Zugriff auf Velocity. Die Lektion dauert insgesamt ca. 30 Minuten.
Erstellen einer Big-Data-Analyse
Gehen Sie zu Beginn wie folgt vor:
- Öffnen Sie ArcGIS Velocity in einem Webbrowser, und melden Sie sich mit einem ArcGIS Online-Konto an, für das Velocity lizenziert ist.
Es empfiehlt sich, Google Chrome oder Mozilla Firefox zu verwenden.
Hinweis:
Wenn beim Anmelden Probleme auftreten, wenden Sie sich an den Administrator der ArcGIS-Organisation. Möglicherweise muss Ihnen eine ArcGIS Online-Rolle mit Berechtigungen für die Verwendung von ArcGIS Velocity zugewiesen sein.
Weitere Informationen zum Erstellen von Rollen und der Benutzerzuweisung
Die Seite Start wird angezeigt.
- Klicken Sie unter Analysen auf die Registerkarte Big Data, um die Seite Big-Data-Analyse aufzurufen.
Tipp:
Im Abschnitt Erste Schritte auf der Seite Start finden Sie unter Big-Data-Analyse die Schaltfläche Big-Data-Analyse erstellen.
Auf der Seite Big-Data-Analysen können Sie die folgenden Aktionen für vorhandene Big-Data-Analysen durchführen:
- Überprüfen
- Erstellen
- Start
- Stopp
- Status überprüfen
- Bearbeiten
- Klonen
- Löschen
- Klicken Sie auf Big-Data-Analyse erstellen.
Der Konfigurationsassistent wird geöffnet und die Optionen für den Datenquellentyp werden angezeigt.
Sie haben sich bei Velocity angemeldet und den Prozess zum Erstellen einer Big-Data-Analyse in einem Konfigurationsassistenten gestartet. Der nächste Schritt ist die Konfiguration der Datenquelle.
Konfigurieren der Datenquelle
Die in dieser Lektion verwendeten Daten können von der OpenData-Website von New York City (NYC) heruntergeladen werden. Das vollständige Dataset mit mehr als 1,5 Millionen Datensätzen wurde von dieser Website im CSV-Format heruntergeladen. Die CSV-Datei wird für diese Lektion in einem öffentlichen Amazon S3-Bucket gehostet. Die Verbindungsinformationen werden in den folgenden Schritten angegeben.
Eine Big-Data-Analyse erfordert eine Datenquelle. Führen Sie die folgenden Schritte aus, um eine Datenquelle zu konfigurieren:
- Klicken Sie im Schritt Datenquellentyp auswählen unter der Kategorie Cloud auf Alle anzeigen.
Hinweis:
Für alle Big-Data-Analysen muss mindestens eine Eingabe-Datenquelle vorhanden sein.
- Wählen Sie unter Cloud-Optionen Amazon S3 aus.
Weitere Informationen zu Azure Blob Storage, Azure Cosmos DB oder Amazon S3
- Legen Sie im Dialogfeld Amazon S3 konfigurieren für den Schritt Amazon S3-Bucket konfigurieren die Parameter wie folgt fest:
- Wählen Sie für Zugriffsmodus die Option Öffentlich aus.
- Geben Sie unter Bucket-Name arcgis-velocity-public ein.
- Wählen Sie für Region die Region USA West (Oregon) aus.
- Unter Ordnerpfad (optional) geben Sie /nyc-motor-vehicle-collisions ein.
- Unter Dataset geben Sie NYPD_Motor_Vehicle_Collisions.csv ein.
- Klicken Sie auf Weiter, um die Parameter des Amazon S3-Buckets anzuwenden.
Die Datenquelle wird überprüft, und es werden Stichproben der Ereignisdaten für das Überprüfen zurückgegeben. Der nächste Schritt ist das Bestätigen des Datenschemas.
Bestätigen des Datenschemas
Nachdem die Amazon S3-Bucket-Parameter eingestellt sind, können Sie das Datenschema bestätigen. Beim Konfigurieren einer Datenquelle ist es wichtig, das Schema der geladenen Daten zu definieren. Velocity definiert das Schema, wenn die Quelldaten einschließlich der Werte für die Optionen Datumsformat, Feldtrennzeichen, Feldtypen und Feldnamen abgefragt werden.
- Überprüfen und bestätigen Sie im Schritt Schema bestätigen, dass das Schema der Daten in etwa so aussieht wie in der folgenden Abbildung: .
Velocity hat die Verbindung mit der Datenquelle getestet, erste Stichproben der Datensätze entnommen und aus diesen Datensätzen das Schema der Daten abgeleitet. Sie können bei Bedarf die Werte für Datenformat, Feldtrennzeichen, Feldtypen und Feldnamen ändern, um sicherzustellen, dass das Schema gültig ist. Für die Zwecke dieser Lektion akzeptieren Sie die Standardparameter des Schemas.
- Klicken Sie auf Weiter, um das Schema als Stichprobe zu bestätigen.
Der Konfigurationsassistent wechselt zum nächsten Schritt.
Schlüsselfelder identifizieren
In diesem Schritt werden die Felder für die räumlichen und zeitlichen Funktionen angegeben, indem Werte für die Parameter Position, Datum und Uhrzeit sowie Tracking ausgewählt werden, so dass Velocity die Geometrie, die Datumsinformationen und einen eindeutigen Bezeichner für die Daten ordnungsgemäß aufbauen kann.
Führen Sie die folgenden Schritte aus, um die Schlüsselfelder zu ermitteln:
- Wählen Sie für Positionstyp den Typ X-/Y-Felder aus.
- Wählen Sie für X (Längengrad) die Option Längengrad aus.
- Wählen Sie für Y (Breitengrad) die Option Breitengrad aus.
- Wählen Sie für Z (Höhe) die Option Kein aus.
- Übernehmen Sie für Raumbezug den Standardwert GCS WGS 1984.
- Wählen Sie für Weisen Ihre Daten Datumsfelder auf? die Antwort Nein.
Mithilfe dieses Parameters kann ein Feld für Start- und Enddatum oder ein Datums-/Uhrzeitfeld in der Datenquelle festgelegt werden. Wenn die eingehenden Daten Datumsinformationen in einem Zeichenfolgenformat enthalten, ist ein Datumsformat erforderlich. Für die Zwecke dieser Lektion werden keine Datums- oder Zeitangaben angegeben.
Weitere Informationen zu den Parametern für Datum und Uhrzeit
- Wählen Sie für Track-ID die Option Die Daten verfügen über keine Track-ID aus.
Mit diesem Parameter kann ein Track-ID-Feld in der Datenquelle festgelegt werden. In dieser Lektion definieren Sie keine Track-ID.
- Klicken Sie auf Abschließen, um die neue Datenquelle zu erstellen.
Die neue Datenquelle Amazon S3 wird dem Analyse-Editor hinzugefügt.
Erstellen der Big-Data-Analyse
Nachdem die Datenquelle dem Analyse-Editor hinzugefügt wurde, können Sie nun die Big-Data-Analyse erstellen.
- Klicken Sie auf der Seite Neue Big-Data-Analyse auf Analyse erstellen.
Das Dialogfeld Analyse erstellen wird angezeigt.
- Geben Sie unter Titel den Titel NYC Cyclist Accidents ein.
- Geben Sie unter Zusammenfassung den Text Process motor vehicle accidents to identify and analyze those involving cyclists ein.
- Wählen Sie unter Ordner den Ordner aus, in dem die Big-Data-Analyse erstellt werden soll.
- Klicken Sie auf Analyse erstellen, um die Analyse zu erstellen.
Der Analyse-Editor wird erneut mit mehr Optionen auf der Werkzeugleiste angezeigt.
Hinzufügen von Werkzeugen zu der Analyse
Nachdem die neue Analyse erstellt wurde, können Sie dieser jetzt Werkzeuge hinzufügen, mit denen die Big-Data-Analyse der Radfahrer-Unfalldaten von New York City ausgeführt wird. Velocity ermöglicht Ihnen die Konfiguration von Analyse-Pipelines.
Zunächst fügen Sie das Werkzeug Feld berechnen hinzu. Anschließend fügen Sie ein TotalCyclistCasualties-Feld hinzu, in dem die Werte in den Feldern NUMBER_CYCLIST_INJURED und NUMBER_CYCLIST_KILLED für jeden einzelnen Datensatz aus der Datenquelle summiert werden.
Führen Sie die folgenden Schritte durch, um sequenzielle Werkzeuge für die Untersuchung von Kfz-Unfällen, bei denen Radfahrer verletzt wurden, zu konfigurieren.
- Klicken Sie im Menü Knoten hinzufügen auf Daten verwalten, und wählen Sie das Werkzeug Feld berechnen aus.
Das Werkzeug Feld berechnen wird dem Analyse-Editor hinzugefügt.
- Verbinden Sie die Amazon S3-Datenquelle mit dem Werkzeug Feld berechnen.
Positionieren Sie ggf. das Werkzeug und die Datenquelle im Analyse-Editor neu, um eine Verbindung zu ermöglichen. Durch eine Verbindung wird sichergestellt, dass das Werkzeug Feld berechnen die zu verwendende Datenquelle kennt.
- Doppelklicken Sie auf das Werkzeug Feld berechnen, um auf dessen Eigenschaften zuzugreifen.
- Klicken Sie auf Feldberechnung hinzufügen, und wählen Sie Neues Feld aus.
- Geben Sie unter Feld den Text TotalCyclistCasualties ein.
- Klicken Sie auf den Dropdown-Pfeil Typ, und wählen Sie Int64 aus.
Damit geben Sie an, dass der Feldtyp ein ganzzahliges 64-Bit-Feld ist.
- Klicken Sie auf Arcade-Ausdruck konfigurieren, um das Dialogfeld Arcade-Ausdruck konfigurieren zu öffnen.
- Verwenden Sie den Arcade-Ausdruck-Generator, und geben Sie $feature.NUMBER_CYCLIST_INJURED+$feature.NUMBER_CYCLIST_KILLED ein.
- Klicken Sie auf Ausführen, um den Arcade-Ausdruck auszuführen.
Das Ergebnis sollte in etwa folgendermaßen aussehen:
- Klicken Sie auf OK, um den Ausdruck zu speichern.
- Klicken Sie auf Feldberechnung hinzufügen, um die neue Feldberechnung zum Werkzeug Feld berechnen hinzuzufügen.
Tipp:
Bei Bedarf können Sie weitere Feldberechnungen hinzufügen. In dieser Lektion wird nur eine Berechnung verwendet.
- Klicken Sie auf Übernehmen, um die Berechnung auf die Eigenschaften des Werkzeugs Feld berechnen zu übernehmen.
Das Werkzeug Feld berechnen ist konfiguriert und mit der Amazon S3-Datenquelle verbunden. Als Nächstes können Sie die Kfz-Unfalldaten von New York City filtern, um die Unfälle mit gültigen Standortkoordinaten zu identifizieren, die zu einer Verletzung oder zum Tod eines Radfahrers geführt haben.
- Klicken Sie im Analyse-Editor auf Speichern, um die Konfiguration der Big-Data-Analyse zu speichern.
- Klicken Sie im Menü Knoten hinzufügen auf Daten verwalten, und wählen Sie das Werkzeug Nach Ausdruck filtern aus.
Dem Analyse-Editor wird ein Werkzeug Nach Ausdruck filtern hinzugefügt.
- Ziehen Sie das Werkzeug Nach Ausdruck filtern hinter das Werkzeug Feld berechnen, und verbinden Sie die beiden Knoten.
- Doppelklicken Sie auf das Werkzeug Nach Ausdruck filtern, um die Eigenschaften zu öffnen und das Werkzeug wie folgt zu konfigurieren:
- Klicken Sie auf Arcade-Ausdruck konfigurieren, um das Dialogfeld Arcade-Ausdruck konfigurieren zu öffnen.
- Verwenden Sie den Arcade-Ausdruck-Generator, oder geben Sie $feature.TotalCyclistCasualties>0 && $feature.LATITUDE>0 ein.
In diesem Dataset gibt es Datensätze mit ungültigen Koordinaten. Diese Datensätze können ignoriert werden, indem die Datensätze herausgefiltert werden, deren Breitengrad kleiner als oder gleich 0 ist.
- Klicken Sie auf Ausführen, um den Arcade-Ausdruck auszuführen.
Das Ergebnis sollte in etwa folgendermaßen aussehen:
- Klicken Sie auf OK, um zu den Eigenschaften des Werkzeugs Nach Ausdruck filtern zurückzukehren.
- Klicken Sie auf Übernehmen, um den Ausdruck anzuwenden.
Der Filter wird hinzugefügt. Als Nächstes fügen Sie das Werkzeug Punkte aggregieren hinzu. Mit diesem werden Punkte räumlich aggregiert, um die Anzahl der Unfälle, die zu Verletzungen oder zum Tod von Radfahrern geführt haben, als reguläre hexagonale Abschnitte darzustellen.
- Klicken Sie im Menü Knoten hinzufügen auf Daten zusammenfassen, und wählen Sie das Werkzeug Punkte aggregieren aus.
Das Werkzeug Punkte aggregieren wird dem Analyse-Editor hinzugefügt.
- Klicken Sie im Analyse-Editor auf Speichern, um die aktualisierte Konfiguration der Big-Data-Analyse zu speichern.
- Ziehen Sie das Werkzeug Punkte aggregieren hinter das Werkzeug Nach Ausdruck filtern, und verbinden Sie die beiden Knoten.
- Doppelklicken Sie auf das Werkzeug Punkte aggregieren, um dessen Eigenschaften zu öffnen und das Werkzeug wie folgt zu konfigurieren:
- Wählen Sie für Punkte zusammenfassen die Option Abschnitte aus.
- Wählen Sie für Abschnittstyp den Typ Hexagon aus.
- Geben Sie als Abschnittsgröße die Zahl 250 ein, und lassen Sie die Maßeinheit auf Meter festgelegt.
- Behalten Sie den Abschnitt Zeitschritt bei, und klicken Sie im Abschnitt Zusammenfassungsfelder auf Zusammenfassungsfeld hinzufügen.
Der Bereich "Eigenschaften" wird angezeigt.
- Wählen Sie unter Attribut die Option TotalCyclistCasualties aus.
- Wählen Sie für Statistik die Option Summe aus.
- Lassen Sie für Ausgabefeldname den Standardnamen TotalCyclistCasualties_Sum unverändert.
- Klicken Sie auf Zusammenfassungsfeld hinzufügen, um ein Zusammenfassungsfeld hinzuzufügen.
- Klicken Sie auf Übernehmen, um die Eigenschaften des Werkzeugs zu übernehmen.
Sie haben erfolgreich drei Analysewerkzeuge hinzugefügt, mit denen die Unfalldaten verarbeitet werden. Als Nächstes fügen Sie eine Ausgabe hinzu.
Hinzufügen einer Ausgabe zur Analyse
Nachdem Sie die Datenquelle und die Analysewerkzeuge erstellt haben, besteht der letzte Schritt in dieser Lektion darin, dass Sie eine Ausgabe hinzufügen, mit der die verarbeiteten Ereignisdaten an einen Feature-Layer gesendet werden, der auf einer Webkarte visualisiert werden kann.
Führen Sie die folgenden Schritte aus, um Schritte zu einer Ausgabe hinzuzufügen:
- Klicken Sie im Menü Knoten hinzufügen auf Ausgaben, und wählen Sie Ausgabe Feature-Layer (neu) aus.
Das Dialogfeld Feature-Layer konfigurieren (neu) wird angezeigt.
- Im Schritt Feature-Layer konfigurieren konfigurieren Sie die Eigenschaften wie folgt:
- Aktivieren Sie die Option Daten in einem Feature-Layer vom Typ "spatiotemporal" speichern.
- Wählen Sie als Datenspeichermethode die Option Alle neuen Features hinzufügen aus.
Wenn Sie eine Datenquelle verwendet haben, zu der eine Track-ID definiert wurde, wenden Sie die Methode Nur das neueste Feature für jeden Track-ID-Wert beibehalten an. Mit dieser Speichermethode wird bei jedem Empfang eines neuen Features für eine bestimmte Track-ID das gespeicherte Feature, das mit dieser Track-ID verknüpft ist, durch das neue Feature ersetzt.
- Wählen Sie für Bei jeder Ausführung der Analyse die Option Vorhandene Features und Schema ersetzen aus.
Wenn Vorhandene Features und Schema ersetzen ausgewählt ist, werden bei jedem Ausführen der Big-Data-Analyse die Features und das Schema im Ausgabe-Feature-Layer überschrieben. Dies ist hilfreich, wenn Sie eine Big-Data-Analyse erstellen und zwischen den einzelnen Ausführungen der Analyse Werkzeuge hinzufügen, entfernen oder ändern. Die Option Vorhandene Features und Schema beibehalten ist hingegen hilfreich, wenn Sie bei jedem Ausführen der Big-Data-Analyse Datensätze anhängen möchten.
- Klicken Sie auf Weiter.
- Geben Sie im Schritt Speichern unter Feature-Layer-Name den Text Cyclist_Accident_Aggregation ein.
- Als Feature-Layer-Zusammenfassung geben Sie NYC cyclist accident aggregated feature layer ein.
- Wählen Sie als Ordner den Ordner aus, in dem der Feature-Layer gespeichert werden soll.
- Klicken Sie auf Abschließen, um die neue Ausgabe zu speichern.
Die neue Ausgabe Cyclist_Accident_Aggregation wird dem Analyse-Editor hinzugefügt.
- Ziehen Sie die Ausgabe Cyclist_Accident_Aggregation hinter das Werkzeug Punkte aggregieren, und verbinden Sie die beiden Knoten.
Tipp:
Sie können die Knoten verschieben, um das optische Erscheinungsbild des Modells zu verbessern.
- Klicken Sie auf Speichern, um die Big-Data-Analyse NYC Cyclist Accidents zu speichern.
Starten der Big-Data-Analyse
Nachdem Sie nun erfolgreich eine Big-Data-Analyse mit den erforderlichen Knoten konfiguriert haben, können Sie die Analyse starten. Die Analyse lädt mehr als 1,5 Millionen Datensätze unter Verwendung eines definierten Schemas aus der CSV-Datei, verarbeitet die Ereignisdaten mit verschiedenen Werkzeugen und schreibt die Analyseausgabe in einen neuen Feature-Layer.
Führen Sie die folgenden Schritte aus, um die Analyse einmal auszuführen:
- Klicken Sie im Analyse-Editor auf Start, um die Big-Data-Analyse NYC Cyclist Accidents zu starten.
Der Text der Schaltfläche Start wird zur Schaltfläche Initialisierung stoppen und dann zu zur Schaltfläche Stoppen. Damit wird angezeigt, dass die Analyse gestartet wurde und ausgeführt wird.
Hinweis:
Feeds und Echtzeitanalyse werden nach dem Starten in Velocity ausgeführt, bis sie beendet werden. Big-Data-Analysen hingegen werden automatisch beendet, sobald sie abgeschlossen sind. Mit den Optionen im Dropdown-Menü Zeitplan im Analyse-Editor kann die wiederholte Ausführung von Big-Data-Analysen konfiguriert werden. Analysen können einmal, regelmäßig oder zu einem wiederkehrenden Zeitpunkt ausgeführt werden.
Weitere Informationen zum Planen von wiederkehrenden Big-Data-Analysen
- Überwachen Sie die Analyse, bis sich der Text der Schaltfläche Stoppen wieder in Start ändert.
Dies bedeutet, dass die Analyse einmal ausgeführt wurde, abgeschlossen ist und jetzt nicht mehr ausgeführt wird. Sie können außerdem auf der Seite Big-Data-Analyse den Status von Big-Data-Analysen überwachen.
Untersuchen der Analyseergebnisse in einer Webkarte
Als Sie im vorherigen Abschnitt die Big-Data-Analyse gestartet haben, wurde ein Ausgabe-Feature-Layer erstellt. Sie öffnen jetzt diesen Ausgabe-Feature-Layer in einer Webkarte, und zeigen die Ergebnisse der Big-Data-Analyse der Radfahrer-Unfalldaten von New York City an.
- Klicken Sie im Hauptmenü unter Ausgabe auf die Registerkarte Layer, um die Seite Layer zu öffnen.
- Suchen Sie in der Liste den Feature-Layer Cyclist_Accident_Aggregation, und klicken Sie auf das Symbol In Map Viewer öffnen, um den Layer in einer Webkarte zu überprüfen.
Hinweis:
Durch Echtzeit- oder Big-Data-Analysen erstellte Ausgabe-Layer werden erst auf der Seite Layer angezeigt, wenn die Analyse ausgeführt wurde und eine Ausgabe generiert hat.
- Klicken Sie oben in Map Viewer Classic auf In Map Viewer öffnen, um den Feature-Layer Cyclist_Accident_Aggregation in Map Viewer anzuzeigen.
- Vergrößern Sie die Ansicht, um die Daten für New York City, USA, in den Blick zu bekommen.
- Klicken Sie auf der Werkzeugleiste Inhalt (dunkel) auf Grundkarte, und ändern Sie die Grundkarte in Dunkelgrauer Hintergrund.
- Klicken Sie für den Feature-Layer Cyclist_Accident_Aggregation auf Styles.
- Wählen Sie für Attribute auswählen die Option Anzahl aus dem Dropdown-Menü, und klicken Sie auf Hinzufügen.
- Wählen Sie bei Bedarf unter Style auswählen die Option Anzahl und Mengen (Farbe) aus, und klicken Sie dann auf Style-Optionen.
- Klicken Sie unter Style-Optionen auf Symbol-Style. Ändern Sie unter Farben den Farbverlauf in Rot- und Gelbtöne. Klicken Sie nach dem Anpassen der Farbe auf Fertig, um den Symbol-Style zu schließen.
- Scrollen Sie zum Ende der Style-Optionen, und aktivieren Sie die Umschaltfläche Daten klassifizieren ein, um die Daten zu gruppieren und Bereiche mit einer höheren Anzahl von Unfällen mit Radfahrern hervorzuheben.
- Klicken Sie unter der Umschaltfläche Daten klassifizieren auf den Dropdown-Pfeil Methode. Wählen Sie Standardabweichung aus, und legen Sie die Klassengröße auf die Standardabweichung 1 fest.
- Übernehmen Sie die anderen Standardeigenschaften, klicken Sie dann auf Fertig.
Die Webkarte ist festgelegt und kann überprüft werden. Sie können in der Webkarte schwenken und zoomen, um die Ergebnisse der Big-Data-Analyse zu erkunden und die Gebiete zu identifizieren, in denen es mehr Verletzungen und Todesfälle bei Radfahrern gab, und die Gebiete mit weniger.
Zusätzliche Quellen
Sie haben in dieser Lektion eine Big-Data-Analyse erstellt und ausgeführt, mit der rund 1,5 Millionen von Radfahrerunfällen analysiert wurden, um die Gebiete in New York City mit der höchsten Unfallzahl zu ermitteln. Auf Grundlage dieser Ergebnisse können Sie fundiertere Entscheidungen darüber treffen, wo eine neue fahrradfreundliche Infrastruktur die größte Wirkung entfalten würde.
Für Ihre weitere Arbeit mit Velocity stehen Ihnen weitere Ressourcen zur Verfügung, wie z. B.: