Создать подключение к многофайловым объектам (GeoAnalytics Desktop)

Краткая информация

Создаёт файл Подключения к многофайловым объектам (.mfc) и его элемент. Наборы данных, зарегистрированные в подключении к многофайловым объектам (MFC), могут использоваться в качестве входных данных для инструментов GeoAnalytics Desktop и других инструментов геообработки.

Использование

  • Используйте этот инструмент для установления соединения с одним или несколькими наборами данных, которые можно использовать в качестве входных данных для инструментов геообработки.

    Примечание:

    Вы можете дополнительно создать подключение к многофайловым объектам с помощью диалогового окна Новое подключение к многофайловым объектам.

  • Подключения к многофайловым объектам поддерживают следующие наборы данных:

    • Файлы с разделителями (такие как .csv, .tsv и .txt)
    • Шейп-файлы (.shp)
    • Файлы Parquet (.parquet)
      Примечание:

      Поддерживаются только зашифрованные файлы Parquet.

    • Файлы ORC (.orc)

    Дополнительные сведения о поддерживаемых типах файлов см. в разделе Подключение к многофайловым объектам.

  • Чтобы использовать наборы данных как входные в MFC, данные должны быть правильно структурированы. Чтобы подготовить данные для MFC, отформатируйте наборы данных как подпапки в одной папке-источнике, которую вы будете регистрировать. В этой папке имена вложенных папок соответствуют именам наборов данных.

    Одна папка-источник с тремя подпапками
    Показана папка-источник, содержащая три подпапки, которые представляют наборы данных.

    На рисунке выше показана правильная структура MFC. Регистрируется папка-источник, каждая подпапка в ней соответствует набору данных. В этом примере вы регистрируете папку-источник, а три набора данных, Dataset-1, Dataset-2 и Dataset-3, будут включены в MFC.

    Более подробно о структурировании подключения к многофайловым объектам

  • Укажите Исходное расположение, из которого вы хотите создать MFC, используя параметр Папка источника данных.

  • MFC может храниться локально на вашем компьютере или на сетевом диске. Если вы предоставляете общий доступ к MFC, убедитесь, что вы используете исходное местоположение, к которому могут получить доступ все пользователи. Рекомендуется не хранить MFC в исходной папке.

  • Чтобы получить доступ к MFC в проекте, добавьте расположение сохраненного MFC в качестве подключения к папке.

  • Установка видимости геометрии или времени не приводит к удалению геометрии или времени из наборов данных. Настройки времени и геометрии будут применяться всегда. Например, если у вас есть набор точечных данных с геометрией, представленной двумя полями, latitude и longitude, ниже показано, как настройка видимости будет работать с вашим набором данных:

    • Видимый – поля latitude и longitude будут доступны в параметрах и результатах инструмента геообработки.
    • Невидимый – поля latitude и longitude не будут доступны в параметрах и результатах инструмента геообработки.

    В обоих случаях набор данных будет иметь геометрию, определенную полями latitude и longitude.

  • При использовании длинных строковых значений, таких как WKT, для представления геометрии рекомендуется установить поля геометрии Невидимыми.

  • Не рекомендуется вручную изменять файл .mfc. Файл .mfc имеет следующие свойства:

    • Информация о подключении – исходный путь
    • Информация о наборе данных – имена и типы наборов данных, поля, геометрия и время

  • Сообщения инструмента будут содержать следующую информацию об обнаруженных наборах данных и их статусе:

    • Успешно – новые наборы данных, которые были обнаружены и добавлены в MFC
    • Неудачно – наборы данных, которые не были успешно добавлены в MFC

    При поиске наборов данных в MFC может возникнуть две проблемы:

    • Ожидаемые наборы данных отсутствуют. В этом случае проверьте, что указан правильный путь, который задает папку-источник, содержащую подпапки, и что тип данных поддерживается.
    • Не удается зарегистрировать один или несколько наборов данных. Если наборы данных не удается зарегистрировать, изучите следующее:

      ПроблемаРешениеПример

      Формат наборов данных не отвечает требованиям.

      Откройте файл, чтобы убедиться, что он выглядит как ожидается. Если структура данных неверна, обновите его и повторите попытку.

      Файл .csv содержит несколько строк и описание данных, затем только пустые строки.

      Схемы наборов данных в папке не совпадают.

      Все файлы в папке набора данных должны иметь одинаковую схему. Откройте файлы и сравните схемы. Исправьте не совпадающие схемы и снова попробуйте зарегистрировать набор данных.

      Один файл .csv содержит 10 полей, другой - только 8.

      Типы файлов набора данных в папке не совпадают.

      Все файлы в папке набора данных должны иметь одно расширение (тип файла). Проверьте типы файлов в источнике данных и удалите или переместите лишние.

      Набор данных шейп-файла - это та же папка, что и файл Parquet.

      Не распознается формат полей.

      Это происходит редко, но может случиться, если ORC и Parquet используют необычный формат. Убедитесь, что вы используете допустимые форматы полей.

      Используется файл Parquet с неизвестным форматом поля.

    Подробнее о том, почему наборы данных не удастся добавить в файл MFC

  • После создания MFC можно изменить сведения о соединении и наборы данных с помощью следующих инструментов:

  • Этот инструмент геообработки работает на Spark. См. раздел Подключения к многофайловым объектам, чтобы узнать об использовании таких подключений.

Параметры

ПодписьОписаниеТип данных
Выходное расположение подключения к многофайловым объектам
(Дополнительный)

Папка, где будет создан файл .mfc.

Folder
Имя выходного подключения к многофайловым объектам

Имя создаваемого файла .mfc.

String
Тип подключения

Задает тип подключения для создания.

  • ПапкаПодключитесь к местоположению файловой системы. Это значение по умолчанию
String
Папка источника данных
(Дополнительный)

Папка, содержащая наборы данных, которые должны быть зарегистрированы в MFC.

Folder
Видимые поля геометрии
(Дополнительный)

Задает, будут ли поля, использующиеся для задания геометрии, отображаться как поля, если файл MFC используется как входные данные для других инструментов геообработки. Если поля геометрии не отображаются, геометрия по-прежнему применяется к набору данных. Параметр настройки видимости геометрии можно изменить в MFC.

  • Отмечено — поля геометрии будут использоваться как поля для анализа. Используется по умолчанию.
  • Не отмечено — поля геометрии не будут использоваться как поля для анализа.

Boolean
Видимые поля времени
(Дополнительный)

Задает, будут ли поля, использующиеся для задания времени, отображаться как поля, если файл MFC используется как входные данные для других инструментов геообработки. Если поля времени не отображаются, время по-прежнему применяется к набору данных. Параметр настройки видимости времени можно изменить в MFC.

  • Отмечено — поля времени будут использоваться как поля для анализа. Используется по умолчанию.
  • Не отмечено — поля времени не будут использоваться как поля для анализа.

Boolean

Производные выходные данные

ПодписьОписаниеТип данных
Выходное MFC

Файл .mfc создан.

File

arcpy.geoanalytics.CreateBDC({bdc_location}, bdc_name, connection_type, {data_source_folder}, {visible_geometry}, {visible_time})
ИмяОписаниеТип данных
bdc_location
(Дополнительный)

Папка, где будет создан файл .mfc.

Folder
bdc_name

Имя создаваемого файла .mfc.

String
connection_type

Задает тип подключения для создания.

  • FOLDERПодключитесь к местоположению файловой системы. Это значение по умолчанию
String
data_source_folder
(Дополнительный)

Папка, содержащая наборы данных, которые должны быть зарегистрированы в MFC.

Folder
visible_geometry
(Дополнительный)

Задает, будут ли поля, использующиеся для задания геометрии, отображаться как поля, если файл MFC используется как входные данные для других инструментов геообработки. Если поля геометрии не отображаются, геометрия по-прежнему применяется к набору данных. Параметр настройки видимости геометрии можно изменить в MFC.

  • GEOMETRY_VISIBLEПоля геометрии будут использоваться как поля для анализа. Используется по умолчанию.
  • GEOMETRY_NOT_VISIBLEПоля геометрии не будут использоваться как поля для анализа.
Boolean
visible_time
(Дополнительный)

Задает, будут ли поля, использующиеся для задания времени, отображаться как поля, если файл MFC используется как входные данные для других инструментов геообработки. Если поля времени не отображаются, время по-прежнему применяется к набору данных. Параметр настройки видимости времени можно изменить в MFC.

  • TIME_VISIBLEПоля времени будут использоваться как поля для анализа. Используется по умолчанию.
  • TIME_NOT_VISIBLEПоля времени не будут использоваться как поля для анализа.
Boolean

Производные выходные данные

ИмяОписаниеТип данных
output_bdc

Файл .mfc создан.

File

Пример кода

CreateBDC (автономный скрипт)

Скрипт Python, демонстрирующий использование функции CreateBDC.

# Name: CreateBigDataConnection.py
# Description: Establishes a connection to a folder location containing one or 
#              more datasets. Datasets will be used as input to GeoAnalytics 
#              Desktop Tools.
#
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
sourceFolder = r"\\FileShare\MyLargeDatasets"
outName = "my_new_MultifileFeatureConnection"
outFolder = r"c:\Projects\MyProjectFolder"
time = "TIME_NOT_VISIBLE"
geometry = "GEOMETRY_VISIBLE"

# Run Create Multifile Feature Connection
arcpy.gapro.CreateBDC(outFolder, outName, "FOLDER", sourceFolder, geometry, time)

Параметры среды

Этот инструмент не использует параметры среды геообработки