Разработка аналитики больших данных—ArcGIS Velocity

Шаги в этом уроке описывают, как создавать аналитику больших данных с использованием ArcGIS Velocity. В примере рассматривается роль специалиста по планированию перевозок, который стремится лучше понять дорожно-транспортные происшествия с участием велосипедистов за многолетний период. Полученные результаты помогут определить, где строительство новой инфраструктуры, удобной для велосипедистов, такой как велосипедные дорожки или ограждения, окажет наибольшее влияние на безопасность велосипедистов.

Пройдя все этапы этого урока вы создадите новую аналитику больших данных, настроите источник данных, сконфигурируете инструменты и создадите выходной векторный слой, содержащий аналитические результаты, которые можно просмотреть на веб-карте.

Это упражнение подходит для начинающих. Вам необходимо подключиться к организации ArcGIS Online с доступом к Velocity. Примерное время выполнения этого простого урока - 30 минут.

Создать аналитику больших данных

Для начала выполните следующие действия:

В веб-браузере откройте ArcGIS Velocity и войдите в организацию ArcGIS Online, у которой есть лицензия на Velocity.
Рекомендуется Google Chrome или Mozilla Firefox.
Примечание:
Если при входе в систему у вас возникнут проблемы, обратитесь к администратору ArcGIS вашей организации. Может потребоваться назначить вам роль с правом использования ArcGIS Velocity.
Более подробно о создании ролей и назначении пользователей.
Появится Главная страница.
В главном меню, в разделе Аналитики щелкните Большие данные, чтобы перейти на страницу Аналитики больших данных.
Подсказка:
В разделе Начало работы на Главной странице есть кнопка быстрого доступа Создать аналитику больших данных в разделе Аналитика больших данных.
На странице Аналитика больших данных вы можете выполнить следующие действия с существующей аналитикой больших данных:
- Просмотр
- Создание
- Начало
- Остановка
- Проверьте статус
- Редактировать
- Клонировать
- Удалить
- Общий доступ
- Просмотр журнала
- Проверка метрик
Щелкните Создать аналитику больших данных.
Откроется мастер настройки, и на экране появятся опции типа источника данных.

Вы вошли в Velocity и запустили процесс создания аналитики больших данных с помощью мастера настройки. Следующий шаг — настроить источник данных.

Настройка источника данных

Данные, использованные в этом уроке, можно загрузить с сайта New York City (NYC) OpenData, Полный набор данных из более, чем 1,5 миллиона записей был загружен с этого сайта в формате значений, разделенных запятыми (CSV). Для этого урока файл .csv был размещен в общедоступном бакете Amazon S3. Информация о подключении предоставлена ниже.

Для аналитики больших данных требуется источник данных. Выполните следующие шаги для настройки источника данных:

Для Выбрать тип источника данных щелкните Смотреть все в категории Облако.
Примечание:
Вся аналитика больших данных должна иметь хотя бы один источник данных в качестве входных данных.
В разделе Опции облака, выберите Amazon S3.
Подробнее о Azure Blob Store, Azure Cosmos DB или Amazon S3.
В диалоговом окне Настроить Amazon S3 для Настроить бакет Amazon S3 задайте параметры следующим образом:
1. Для Режима доступа выберите Общий.
2. Для Имени бакета введите arcgis-velocity-public.
3. Для Региона выберите US West (Oregon).
4. Для Путь к папке (дополнительно) введите /nyc-motor-vehicle-collisions.
5. Для Набор данных введите NYPD_Motor_Vehicle_Collisions.csv.
Щелкните Далее, чтобы применить параметры бакета Amazon S3.
Источник данных проверяет и возвращает выборочные данные о событиях для проверки. Следующий шаг - подтвердить схему данных.

Amazon S3 настроен в качестве источника данных.

Подтверждение схемы данных

Задав параметры бакета Amazon S3, вы можете подтвердить схему данных. При настройке источника данных важно определить схему данных, которые вы загружаете. Velocity определяет схему при выборке исходных данных, включая значения опций Формат данных, Разделитель полей, Тип поля и Имя поля.

Для Подтвердить схему проверьте и убедитесь, что схема данных аналогична той, которая показана на рисунке:
Velocity проверил соединение с источником данных, отобрал первые несколько записей данных и интерпретировал схему данных на основе выбранных записей. При необходимости вы можете изменить значения Формат данных, Разделитель полей, Тип поля и Имя поля, чтобы настроить корректную схему. Для целей этого урока примите параметры схемы по умолчанию.
Нажмите Далее, чтобы подтвердить схему из примера.

Определение ключевых полей

На этом этапе задаются поля для пространственных и временных возможностей путем выбора значений параметров Местоположение, Дата и время и Отслеживание, чтобы Velocity смог правильно построить геометрию, информацию о датах и уникальный идентификатор для данных.

Выполните следующие шаги для определения ключевых полей:

Для Типа местоположения выберите Поля X/Y.
Для X (долгота) выберите Longitude.
Для Y (широта) выберите Latitude.
Для Z (высота) выберите Нет.
Для параметра Пространственная привязка оставьте значение по умолчанию GCS WGS 1984.
Для Есть ли в ваших данных поля даты? выберите Нет.
Этот параметр можно использовать для выбора дат начала и окончания или поля даты-времени в источнике данных. Если входные данные содержат информацию о дате в строковом формате, тогда требуется формат даты. Для целей этого урока информация о дате или времени не указывается.
Подробнее о параметрах даты и времени
Для ID трека выберите Данные не имеют ID трека.
Этот параметр можно использовать для назначения поля ID трека в источнике данных. В этом уроке не задавайте ID трека.
Щелкните Завершить, чтобы создать новый источник данных.

Источник данных Amazon S3 добавляется в редактор аналитики.

Создание аналитики больших данных

Теперь, когда источник данных добавлен в редактор аналитики, вы можете создать аналитику больших данных.

На странице Новая аналитика больших данных щелкните Создать аналитику.
Откроется диалоговое окно Создать аналитику.
Для Заголовок введите NYC Cyclist Accidents.
В Краткой информации введите Обработка дорожно-транспортных происшествий с целью выявления и анализа тех, в которых участвуют велосипедисты.
Для Папки выберите папку, где вы хотите создать аналитику больших данных.
Щелкните Создать аналитику, чтобы создать новую аналитику.

На панели инструментов снова появится редактор аналитики с дополнительными опциями.

Добавление и настройка инструмента аналитики

Создав новую аналитику, вы можете добавить инструменты, которые будут выполнять анализ больших данных по данным об авариях велосипедистов в городе Нью-Йорк. Velocity позволяет настроить конвейер аналитики.

Сначала, добавьте инструмент Вычислить поле, а затем добавите поле TotalCyclistCasualties, которое суммирует значения в полях NUMBER_CYCLIST_INJURED и NUMBER_CYCLIST_KILLED для каждой отдельной записи из источника данных.

Настройте последовательные инструменты для лучшего понимания дорожно-транспортных происшествий, связанных с травмами велосипедистов.

В меню Добавить узел щелкните Управление данными и выберите инструмент Вычислить поле.
Инструмент Вычислить поле добавлен в редактор аналитики.
Подключите источник данных Amazon S3 к инструменту Вычислить поле.
При необходимости измените положение инструмента и источника данных в редакторе аналитики, чтобы упростить подключение. Подключение гарантирует, что инструмент Вычислить поле знает, какой источник данных следует использовать.
Дважды щелкните инструмент Вычислить поле для доступа к его свойствам.
Щелкните Добавить вычисление поля и выберите Новое поле.
Для Поле введите TotalCyclistCasualties.
Щелкните стрелку ниспадающего меню Тип и выберите Int64.
Это определяет, что тип поля будет 64-битным целочисленным.
Щелкните Настроить выражение Arcade, чтобы открыть диалоговое окно Настроить выражение Arcade.
1. Используйте конструктор выражений Arcade или введите $feature.NUMBER_CYCLIST_INJURED+$feature.NUMBER_CYCLIST_KILLED.
2. Щелкните Запустить, чтобы запустить выражение Arcade.
  Результат должен соответствовать следующей иллюстрации:
3. Щелкните OK, чтобы сохранить выражение.
4. Нажмите Отменить вычисление поля, чтобы вернуться к странице свойств Вычислить поле
5. Щелкните Добавить вычисление поля, чтобы добавить новое вычисление поля в инструмент Вычислить поле.
  Подсказка:
  При необходимости вы можете добавить дополнительные вычисления поля. В этом уроке используется одно.
6. Щелкните Применить, чтобы применить вычисление к свойствам инструмента Вычислить поле.
Инструмент Вычислить поле настроен и подключен к источнику данных Amazon S3. Затем для идентификации ДТП, приведших к травме или смерти велосипедиста, с корректными координатами местоположения, вы можете отфильтровать данные о ДТП в городе Нью-Йорк.
В редакторе аналитики щелкните Сохранить, чтобы сохранить конфигурацию аналитики больших данных.
В меню Добавить узел щелкните Управление данными и выберите инструмент Фильтр по выражению.
Инструмент Фильтр по выражению добавлен в редактор аналитики.
Перетащите инструмент Фильтр по выражению после инструмента Вычислить поле и соедините два узла.
Дважды щелкните инструмент Фильтр по выражению, чтобы открыть его свойства, и настройте параметры следующим образом:
1. Щелкните Настроить выражение Arcade, чтобы открыть диалоговое окно Настроить выражение Arcade.
2. Используйте конструктор выражений Arcade или введите $feature.TotalCyclistCasualties>0&$feature.LATITUDE>0.
  В этом наборе данных есть записи с недопустимыми координатами. Эти записи можно игнорировать, отфильтровав те записи, где значение широты меньше или равны 0.
3. Щелкните Запустить, чтобы запустить выражение Arcade.
  Результат должен соответствовать следующей иллюстрации:
4. Щелкните OK, чтобы вернуться к свойствам инструмента Фильтровать по выражению.
5. Щелкните Применить, чтобы применить выражение.
  Фильтр добавлен Затем добавьте инструмент Агрегировать точки, который будет агрегировать точки в пространстве для представления количества несчастных случаев, связанных с травмой или смертью велосипедиста, в виде обычных гексагональных бинов.
В меню Добавить узел щелкните Суммировать данные и выберите инструмент Агрегировать точки.
Инструмент Агрегировать точки добавлен в редактор аналитики.
В редакторе аналитики щелкните Сохранить, чтобы сохранить обновленную конфигурацию аналитики больших данных.
Перетащите инструмент Агрегировать точки после инструмента Фильтр по выражению и соедините два узла.
Дважды щелкните инструмент Агрегировать точки, чтобы открыть его свойства, и настройте параметры следующим образом:
1. Для Агрегировать точки в выберите Бины.
2. Для Типа бина выберите Гексагон.
3. Для параметра Размер бина введите 250 , а в качестве единиц измерения оставьте Метры.
4. Оставьте раздел Временной шаг без изменений, а в разделе Поле суммирования нажмите Добавить поле суммирования.
  Появится панель свойств.
5. Для параметра Атрибут выберите TotalCyclistCasualties.
6. Для Статистики, выберите Сумма.
7. Для Имя выходного поля оставьте по умолчанию TotalCyclistCasualties_Sum.
8. Для того, чтобы добавить поле суммирования, щелкните Добавить поле суммирования.
9. Щелкните Применить, чтобы применить свойства инструмента.

Вы успешно добавили три аналитических инструмента, которые будут обрабатывать данные об авариях. Далее вы добавите выходные данные.

Настройка выходного векторного слоя

После создания инструментов источника данных и аналитики, следующим шагом в этом уроке будет добавление выходных данных, которые будут отправлять обработанные данные событий в векторный слой, доступный для визуализации на веб-карте.

Примечание:

Название пространственно-временного векторного слоя должно быть уникальными в организации.
В Velocity название пространственно-временного векторного слоя должно отличаться от названий канала и потокового слоя. При наличии повторяющегося имени вы не сможете создать аналитику в реальном времени или больших данных в Velocity. Это относится только к выходным векторным слоям Velocity; это не относится к размещенным векторным слоям ArcGIS Online.

Для добавления выходных данных, выполните следующие шаги:

В меню Добавить узел щелкните Выходные данные и выберите Векторный слой (новый).
Появится диалоговое окно Настроить векторный слой (новый).
Для Настроить векторный слой настройте свойства следующим образом:
1. Включите переключатель Хранение данных в пространственно-временном слое.
2. В Методе хранения данных выберите Добавить все новые объекты.
  Если вы работаете с источником данных, для которого определен track ID, то вы будете использовать метод Сохранять только последний объект для каждого значения Track ID. При таком способе хранения каждый раз, когда для определенного Track ID принимается новый объект, сохраненный объект, связанный с этим Track ID, будет заменен новым объектом.
3. В Каждый раз, когда запускается аналитика выберите Заменять существующие объекты и схему.
  При каждом запуске аналитики больших данных объекты и схемы в выходном слое объектов будут перезаписываться. Это полезно для разработки и тестирования аналитики больших данных, когда вы добавляете, убираете или изменяете инструменты между запусками аналитики.
  Примечание:
  Выберите опцию Сохранить существующие объекты и схему, чтобы добавлять записи к выходным векторным слоям каждый раз при запуске аналитики больших данных.
Щелкните Далее.
Для Сохранить для Имени векторного слоя введите Cyclist_Accident_Aggregation.
В Краткая информация о векторном слое (необязательно) введите NYC cyclist accident aggregated feature layer.
Для Папки выберите папку, в которой вы хотите сохранить слой объектов.
Щелкните Готово, чтобы сохранить новые выходные данные.
Новый результат Cyclist_Accident_Aggregation добавлен в редактор аналитики.
Перетащите результат Cyclist_Accident_Aggregation после инструмента Агрегировать точки и соедините два узла.
Подсказка:
Вы можете перенести узлы, чтобы модель визуально стала более понятной.
Щелкните Сохранить, чтобы сохранить новую аналитику больших данных NYC Cyclist Accidents.

Вы успешно добавили новый выходной векторный слой Cyclist_Accident_Aggregation для просмотра данных о происшествиях в веб-карте.

Запуск аналитики больших данных

Теперь, когда вы успешно настроили аналитику больших данных со всеми необходимыми узлами, вы можете запустить аналитику. Аналитика загрузит более 1,5 миллионов записей из файла .csv с использованием заданной схемы, обработает данные о событиях с помощью различных инструментов и запишет результаты анализа в новый векторный слой.

Выполните следующие шаги для однократного запуска аналитики:

В редакторе аналитики щелкните Пуск, чтобы запустить аналитику больших данных NYC Cyclist Accidents.
Кнопка Пуск становится кнопкой Остановить инициализацию, а затем кнопкой Стоп, указывающей на то, что аналитика запущена и работает.
Примечание:
Каналы и аналитика в реальном времени в Velocity остаются работающими после их запуска. С другой стороны, аналитика больших данных выполняется до завершения анализа и затем автоматически останавливается. Аналитика больших данных может быть настроена на регулярный запуск с помощью опций, доступных в ниспадающем меню Расписание в редакторе аналитики. Опции включают возможность запуска аналитики один раз, периодически или в повторяющееся время.
Подробнее о расписании повторяющейся аналитики больших данных
Контролируйте аналитику, пока кнопка Стоп не переключится обратно на Пуск.
Это указывает на то, что аналитика была запущена, и теперь она завершена и больше не работает. Кроме того, вы можете отслеживать состояние аналитики больших данных со страницы Анализ больших данных.

Вы успешно инициализировали аналитику больших данных NYC Cyclist Accidents.

Исследуйте результаты аналитики на веб-карте

Когда вы начали анализ больших данных в предыдущем разделе, был создан выходной векторный слой. Откройте этот выходной векторный слой на веб-карте и просмотрите результаты анализа больших данных по данным об авариях велосипедистов в Нью-Йорке.

Для того чтобы открыть страницу Слои, в главном меню в разделе Выходные данные щелкните Слои.
Найдите в списке векторный слой Cyclist_Accident_Aggregation и щелкните Открыть в Map Viewer, чтобы просмотреть слой на веб-карте.
Примечание:
Выходные векторные слои, созданные аналитикой в реальном времени и аналитикой больших данных, не отображаются на странице Слои, пока аналитика не будет запущена и не сгенерирован результат.
Для просмотра векторного слоя Cyclist_Accident_Aggregation в Map Viewer щелкните Открыть в Map Viewer в верхней части Map Viewer Classic.
Увеличьте масштаб, чтобы сфокусироваться на данных для Нью-Йорка, США.
На панели инструментов Содержание (темная) щелкните Базовая карта и измените базовую карту на Тёмно-серое полотно.
В векторном слое Cyclist_Accident_Aggregation нажмите Стили.
В разделе Выбрать атрибуты выберите Количество из ниспадающего меню и щелкните Добавить.
При необходимости в разделе Выбрать стиль выберите Числа и количества (цвет) и щелкните Опции стиля.
В разделе Опции стиля щелкните Стиль символа.
В разделе Цвета измените цветовую шкалу на Красные и желтые, нажмите Готово и закройте стиль символа.
Для того, чтобы сгруппировать данные и выделить области с более высоким уровнем травматизма велосипедистов, прокрутите Опции стиля до конца и щелкните переключатель Классифицировать данные.
Под кнопкой переключателя Классифицировать данные нажмите стрелку ниспадающего меню Метод и выберите Среднеквадратическое отклонение, и установите размер класса равный 1 среднеквадратическому отклонению.
Примите другие свойства по умолчанию и нажмите Готово.

Веб-карта настроена и ее можно просматривать. Вы можете перемещаться и изменять масштаб на веб-карте, чтобы исследовать результаты анализа больших данных и определить районы с большим количеством травм и смертей велосипедистов, а также районы с меньшим их числом.

Дополнительные ресурсы

На этом уроке вы создали и запустили аналитику больших данных, которая проанализировала миллионы несчастных случаев с участием велосипедистов, чтобы выявить районы в Нью-Йорке с наибольшим количеством таких случаев. Благодаря этим результатам вы теперь можете принимать более обоснованные решения о том, где новая велосипедная инфраструктура может оказать наибольшее влияние.

Дополнительные ресурсы станут доступны, когда вы продолжите работу с Velocity, включая следующие:

Отзыв по этому разделу?

Создать аналитику больших данных

Примечание:

Подсказка:

Настройка источника данных

Примечание:

Подтверждение схемы данных

Определение ключевых полей

Создание аналитики больших данных

Добавление и настройка инструмента аналитики

Подсказка:

Настройка выходного векторного слоя

Примечание:

Примечание:

Подсказка:

Запуск аналитики больших данных

Примечание:

Исследуйте результаты аналитики на веб-карте

Примечание:

Дополнительные ресурсы

В этом разделе