Вы можете использовать инструменты Data engineering для очистки и подготовки своих данных. Поднабор инструментов обработки доступен в виде Data Engineering, он поможет подготовить ваши данные для использования на карте или в анализе. Инструменты сгруппированы в следующие категории:
- Очистка – очистка данных. Например, вы можете удалить ненужные поля. Вы также можете изменить поля или заполнить пропущенные значения.
- Построение – создайте поля на основе существующих полей или свойств слоя. Например, вы можете добавить и вычислить новое поле, стандартизировать, трансформировать или переклассифицировать существующее поле, а также добавить поле на основе геометрии входного слоя.
- Интеграция – интегрируйте или добавляйте данные из другого источника во входную таблицу или класс объектов. Например, вы можете присоединить или добавить поля, обогатив данные.
- Форматирование – измените форматы полей или переорганизуйте поля в таблице или классе объектов. Например, вы можете конвертировать поля времени, перекодировать категорийные поля или сократить измерения в существующих полях.
Примечание:
Некоторые инструменты геообработки в виде Data Engineering недоступны для не редактируемых слоев. В этом случае рекомендуется сделать редактируемую копию слоя и открыть новый вид Data Engineering.
Доступ к этим группам и инструментам можно получить в виде Data Engineering, выполнив одно из следующего:
- Щелкните правой кнопкой мыши в контекстном меню поля на панели полей.
- Щелкните правой кнопкой мыши в контекстном меню поля на панели статистики.
- Щелкните на инструменте на ленте Data engineering.
Лента Data Engineering
Когда вид Data Engineering станет активным, в верхней части приложения появится контекстная лента. На ленте будет доступ к командам и инструментам для изучения и подготовки данных.
Группа Данные на ленте предоставляет доступ к виду полей и таблице атрибутов для слоя, связанного с активным видом Data Engineering. В группе Инструменты представлены четыре галереи инструментов: Очистка, Построения, Интеграция и Форматирование. Каждая галерея инструментов содержит поднабор инструментов геообработки для соответствующей задачи инженерии данных. По умолчанию слой, связанный с активным видом Data Engineering используется для автоматического заполнения параметра входных объектов для этих инструментов. В группе Пространственные, Отобразить данные XY и Геокодировать таблицу преобразовывают ваши непространственные автономные таблицы в пространственные данные.
Инструменты Data Engineering
Следующие таблицы описывают все инструменты, доступные на ленте Data Engineering
Примечание:
Некоторые из этих инструментов недоступны для непространственных данных, например таких, как автономные таблицы.
Очистка
Следующие инструменты доступны в категории Очистка:
Инструмент | Описание |
---|---|
Удаляет один или несколько полей из класса пространственных объектов, таблицы, слоя объектов или набора растровых данных. | |
Присоединяет или дополнительно обновляет существующий целевой набор данных несколькими входными наборами данных. Входными наборами данных могут быть классы объектов, таблицы, шейп-файлы, растры, классы объектов аннотаций или объектов-размеров. | |
Переименовывает поля и их псевдонимы или меняет свойства поля. | |
Проецирует пространственные данные из одной системы координат в другую. | |
Удаляет все или выбранный поднабор строк из входных данных. | |
Заменяет пропущенные (null) значения на вычисленные на основе значений пространственных соседей, пространственно-временных соседей, временных рядов или значений глобальной статистики. |
|
Определяет глобальные и локальные пространственные выбросы у точечных объектов. |
Построить
Следующие инструменты доступны в категории Построение:
Инструмент | Описание |
---|---|
Вычисляет значения в заданном поле класса объектов, векторного слоя или растра. | |
Добавляет новое поле в автономную таблицу или таблицу класса пространственных объектов или векторного слоя, а также в растры с таблицами атрибутов. |
|
Добавляет информацию к полям атрибутов объектов, представляющим пространственные и геометрические характеристики и местоположение каждого объекта, например, длину, площадь, координаты x, y, z и m-значения. | |
Трансформирует непрерывные значения в одно или несколько полей, путем применения математических функций к каждому значению и изменению формы распределения. Методы трансформирования в инструменте включают логарифм, квадратный корень, Box-Cox, множественную инверсию, квадрат, экспоненты и обратный Box-Cox. | |
Стандартизирует значения в полях, конвертируя их в значения, соответствующие заданному масштабу. Методы стандартизации включают z-оценку, минимум-максимум, абсолютный максимум и надежную стандартизацию. | |
Уменьшает количество измерений набора непрерывных переменных, агрегируя максимально возможное количество дисперсии в меньшее количество компонентов с помощью анализа по методу главных компонент (PCA) или линейного дискриминантного анализа пониженного ранга (LDA). | |
Сглаживает данные временных рядов, что помогает учесть краткосрочные колебания, чтобы выявить долгосрочные тенденции и циклы. Инструмент может использовать числовую переменную одного или нескольких временных рядов с использованием центрированных, прямых и обратных скользящих средних, а также адаптивного метода, основанного на локальной линейной регрессии. |
Интегрировать
Следующие инструменты доступны в категории Интеграция:
Инструмент | Описание |
---|---|
Присоединяет атрибуты из одного объекта к другому на основании пространственного взаиморасположения. В выходной класс объектов записываются целевые объекты (исходного класса) с присоединенными атрибутами из другого класса. | |
Соединяет содержание таблицы с другой таблицей на основе общего атрибутивного поля. Входная таблица обновляется, чтобы содержать поля из присоединенной таблицы. Вы можете выбрать, какие поля из присоединяемой таблицы будут добавлены во входную таблицу. | |
Вычисляет расстояние и дополнительную информацию о близости входных объектов и ближайшего объекта в другом слое или классе пространственных объектов. | |
Выполняет наложение полигонального слоя на другой слой для суммирования числа точек, длин линий и площадей полигонов, а также вычисляющий статистику атрибутивных полей объектов внутри полигонов. | |
Находит объекты, расположенные в пределах заданного расстояния от объектов входного слоя, и вычисляет статистику для этих ближайших объектов. | |
Создает таблицу или класс точечных объектов, содержащую(-ий) значения ячеек растра или набора растров, для конкретных местоположений. Местоположения определяются ячейками растра, точками, полилиниями или полигонами. | |
Обогащает данные, добавляя демографические и географические сведения о людях и местах в местоположениях ваших данных и рядом с ними. Выходными данными является копия входных данных с дополнительными атрибутивными полями. Для этого инструмента требуется учетная запись организации ArcGIS Online или локально установленный набор данных Business Analyst. |
|
Суммирует атрибуты входного полигонального слоя на основе пространственного наложения целевого полигонального слоя и назначает итоговые атрибуты целевым полигонам. Целевые полигоны имеют суммированные числовые атрибуты, полученные из входных полигонов, которые перекрываются каждым целевым полигоном. |
Формат
Следующие инструменты доступны в категории Форматирование:
Инструмент | Описание |
---|---|
Переносит значения даты и времени, хранящиеся в поле, в другое поле. Инструмент можно применять для конвертации между различными типами полей (текстовыми, числовыми или полями дат) или для конвертации значений в другой формат, например, dd/MM/yy HH:mm:ss в yyyy-MM-dd. | |
Конвертирует временные значения, записанные в поле дат, из одного часового пояса в другой. | |
Создает таблицу из входной таблицы за счет сокращения избыточных записей и сжатия отношений один-ко-многим. | |
Трансформирует данные в полях или столбцах в строки в новой таблице или классе объектов. | |
Переклассифицирует значения в числовом или текстовом поле в классы на основе границ, определенных вручную, или применяя метод переклассификации. | |
Преобразует категорийные значения (строка, целое число или дата) в несколько числовых полей, каждое из которых представляет определенную категорию. Закодированные числовые поля могут использоваться в большинстве научных данных и статистических рабочих процессов, включая регрессионные модели. |
Примечание:
Большинство операций геообработки, изменяющих входные данные, нельзя отменить.