Опции импорта

Insights desktop
Примечание:

Data engineering доступно в Insights desktop. Все пользователи Insights in ArcGIS Online и Insights in ArcGIS Enterprise получают доступ к Insights desktop. Дополнительные сведения см. в разделе Введение в ArcGIS Insights.

Data engineering в настоящий момент доступно в Предварительном просмотре.

Инструменты из меню Опции импорта применяются к наборам данных при их добавлении в рабочую книгу данных, но не добавляются в модель данных.

Опции импорта

При импорте набора данных в рабочую книгу данных доступны следующие инструменты:

ИнструментОписание

Фильтр набора данных

Примените расширенный фильтр к набору данных и выберите поля, включаемые в набор данных примера.

Сократить пустые места

Удалите пустые места вначале и в конце строковых значений. Этот инструмент по умолчанию включен.

Метод выборки

Выбрать способ создания выборки набора данных. Этот инструмент доступен для наборов данных, содержащих более 250 000 записей.

Использование опций импорта

Выполните следующие шаги, чтобы применить инструменты импорта к набору данных:

  1. Откройте окно Добавить на страницу, выполнив следующие шаги:
    • Создайте рабочую книгу данных. Окно Добавить на страницу появится, когда рабочая книга данных будет создана.
    • Щелкните кнопку Добавить на страницу над панелью данных в имеющейся рабочей книге данных.
  2. Выберите набор данных для добавления в рабочую книгу данных.
  3. Щелкните кнопку Опции импорта, чтобы выполнить следующие действия:
    • Выберите Фильтр набора данных, чтобы применить расширенный фильтр и выбрать поля, включаемые в набор данных.
    • Выберите, будете ли вы обрезать пустое пространство вначале и в конце строк (по умолчанию включено).
    • Если в наборе данных более 250 000 записей, выберите способ выборки Случайная (по умолчанию) или Фиксированная.
  4. Щёлкните Добавить.

Способы выборки

Есть два способа создания данных выборки: Случайная и Фиксированная.

Произвольно

Метод Случайной выборки случайным образом выбирает 250 000 записей из набора данных. Этот метод, скорее всего, создаст репрезентативную выборку уникальных значений и диапазонов чисел. Однако нечасто встречающиеся значения могут не попасть в выборку. Например, опечатка в текстовом столбце, которая встречается только один раз, может не попасть в случайную выборку, поэтому вы не будете знать, как исправить ее в рамках рабочего процесса data engineering.

Метод Случайной выборки наилучшим образом подходит для большинства наборов данных.

Примечание:

Для поддержки случайной выборки у коннекторов баз данных, которые не поддерживались без настройки, должны быть обновленные файлы конфигурации. Если вы не используете последние файлы конфигурации для коннектора, вам нужно удалить тип коннектора и снова добавить коннектор с последними файлами.

Подключения только к данным в ArcGIS Enterprise не поддерживают случайные выборки, если Insights 2022.2 не установлен в вашей организации.

Случайные выборки могут не поддерживаться для данных из вкладок Living Atlas и ArcGIS public.

Исправлено

Метод Фиксированных выборок выбирает записи в том порядке, в котором они появляются в наборе данных. По умолчанию размер выборки равен 250 000 записям, но вы можете увеличить или уменьшить его при импорте набора данных.

Воспользуйтесь методом Фиксированных выборок, если хотите увеличить размер выборки или ваш набор данных обеспечивает репрезентативную выборку записей в порядке их появления.

Не применяйте метод Фиксированных выборок для наборов данных, упорядоченных способом, который влияет на значения, появляющиеся в выборке. К примеру, набор данных содержит данные о погоде по стране за несколько лет, но первые 250 000 записей включают данные только за первые два месяца. В этом случае данные не будут репрезентативными для дат, температур, количества осадков и других погодных условий, записанных во всем наборе данных.