Подключение к многофайловым объектам (MFC) позволяют быстро подключаться к источникам данных для визуализации и анализа больших наборов данных. MFC предоставляют гибкие возможности для работы и форматирования данных.
MFC ссылается на папку с одним или несколькими наборами данных. Наборы данных в MFC используются как входные данные объектов (точек, полилиний, полигонов и табличных данных) для инструментов геообработки. Когда вы создаете MFC, создается файл .mfc. Этот файл указывает на директорию наборов данных, которые определяют наборы данных и их схему в MFC, включая геометрию и информацию о времени. Вы можете перейти к наборам данных MFC в инструменте геообработки и просмотреть наборы MFC на карте. Ниже приведены примеры использования MFC:
- У вас есть множество шейп-файлов, представляющих большую область. Каждый шейп-файл представляет часть области, и вы хотите использовать все файлы вместе.
- Вы каждый день получаете новый файл .csv с измерениями температур. Вы хотите включить новый файл .csv в набор данных вместе с имеющимися файлами .csv.
- Вы используете данные, которые содержат множество полей, представляющих время события. Вы хотите использовать все поля для представления времени.
- Вам необходимо использовать файлы Parquet.
Использовать MFC в качестве входных данных для инструментов геообработки удобно по следующим причинам:
- Вы можете представить несколько наборов данных с одинаковой схемой и типом файла как один набор данных.
- MFC позволяет работать с данными во время выполнения анализа, поэтому вы можете продолжать добавлять данные в набор, находящийся в MFC без необходимости перерегистрации или публикации своих данных.
- Вы можете изменить MFC, чтобы удалить, добавить или обновить отображение наборов данных.
- MFC отличается гибкостью с точки зрения определения геометрии и времени и допускает несколько форматов времени в отдельном наборе данных.
Поддерживаемые форматы данных
Подключения к многофайловым объектам поддерживают следующие наборы данных:
- Файлы с разделителями (такие как .csv, .tsv и .txt)
- Шейп-файлы (.shp)
- Файлы Parquet (.parquet)
Примечание:
Поддерживаются только зашифрованные файлы Parquet.
- Файлы ORC (.orc)
Если вы используете MFC в инструментах GeoAnalytics Desktop, поддерживаются все входные форматы. Если вы используете наборы данных MFC в любых других инструментах геообработки, поддерживаются только файлы с разделителями и шейп-файлы.
Терминология подключений к многофайловым объектам
В следующей таблице приведены общие термины, встречающиеся при работе с MFC:
Термин | Описание |
---|---|
Подключение к многофайловому объекту | Элемент, представляющий собой файл MFC. Этот файл MFC можно развернуть, чтобы увидеть наборы данных, или раскрыть для использования в инструментах геообработки. Этот файл подключения является интерфейсом AllSource к файлу MFC. |
Файл подключения к многофайловым объектам | Файл (.mfc), который создается и сохраняется при создании MFC с помощью инструмента Создать подключение к многофайловым объектам. Файл содержит информацию о наборах данных и схемах, а также о параметрах геометрии и времени. Когда вы видите этот файл в AllSource, это элемент MFC. Более подробно о файлах подключения к многофайловым объектам |
Набор данных подключения к многофайловым объектам | Набор данных в MFC. Вы можете добавить этот набор данных к карте или использовать как входные данные для инструмента геообработки. |
Местоположение источника | Расположение папки, зарегистрированной как MFC. Это местоположение содержит одну или две папки, представляющие наборы данных MFC. Инструменты подключения к многофайловым объектам не меняют эту папку. |
Данные источника | Наборы данных, зарегистрированные в MFC. Когда вы используете MFC, данные источника не меняются. Инструменты подключения к многофайловым объектам не меняют эти данные. |
Структурирование входных данных
Чтобы использовать наборы данных как входные в MFC, данные должны быть правильно структурированы. Чтобы подготовить данные для MFC, отформатируйте наборы данных как подпапки в одной папке-источнике, которую вы будете регистрировать. В этой папке имена вложенных папок соответствуют именам наборов данных.
На рисунке выше показана правильная структура MFC. Регистрируется папка-источник, каждая подпапка в ней соответствует набору данных. В этом примере вы регистрируете папку-источник, а три набора данных, Dataset-1, Dataset-2 и Dataset-3, будут включены в MFC.
В подпапках наборов данных можно структурировать данные как необходимо. Если эти вложенные папки будут содержать несколько подпапок или файлов, то все содержимое этих подпапок будет считаться отдельным набором данных, они должны использовать одну схему и тип файла.
Примечание:
Все файлы в папке набора данных должны иметь одинаковую схему. Если схема файла отличается, в визуализации и анализе он может быть использован некорректно.
В этом примере, эти три папки наборов данных имеют разное содержимое. Каждый набор данных описан ниже:
- Dataset-1 - набор данных состоит из одного файла, D1-1. Когда Dataset-1 применяется для визуализации или анализа, используется один шейп-файл.
- Dataset-2 - набор данных состоит из двух текстовых файлов: D2-1 и D2-2. Когда Dataset-2 применяется для визуализации или анализа, используются оба текстовых файла.
- Dataset-3 - набор данных состоит из трех папок: D3-Folder-1 и D3-Folder-2, каждая содержит один набор, D3-1 и D3-2. Когда Dataset-3 применяется для визуализации или анализа, используются оба файла D3-1 и D3-2.
Это примеры структуры данных. Количество файлов и папок не влияет на использование данных в визуализации и анализе. Добавление или удаление подпапок из папки набора данных не дает никаких преимуществ; структура папок на этом уровне является свободной.
Чтобы начать использовать подключения к многофайловым объектам, см. раздел Использование подключений к многофайловым объектам.