Загрузка данных в граф знаний

Вы можете создавать элементы и отношения в графе знаний для представления существующих табличных данных. Данные в полях таблицы можно конвертировать в свойства элементов и отношений. Геометрию классов объектов можно загрузить в пространственный объект элемента.

То, как табличные данные будут конвертированы в элементы графа знаний, можно задать с помощью мастера Загрузить таблицу. Когда процесс конвертации будет определен, вы можете сохранить свою работу. Инструкции по конвертации данных сохраняются в исследование в текущем проекте как конфигурация загрузки данных. Существующие конфигурации загрузки данных можно изменить для адаптации сходных таблиц и классов объектов.

Когда вы запускаете процесс конвертации, то данные загружаются в текущий граф знаний исследования. Новую диаграмму связей можно создать для просмотра и оценки результатов процесса конвертации.

Конфигурация загрузки данных определяет то, как читать и управлять данными в таблице. Процесс загрузки таблицы создает элементы и отношения в графе знаний для представления данных. Он также может создавать записи о происхождении, чтобы указать исходный материал, из которого были получены данные.

Открыть мастер Загрузить таблицу

Откройте мастер Загрузить таблицу, чтобы импортировать табличные данные в граф знаний исследования.

  1. Откройте исследование в ArcGIS AllSource.
  2. На вкладке Исследование на ленте в группе Загрузить данные щелкните Загрузить таблицу Загрузить таблицу.

В новом виде появится мастер Загрузить таблицу наряду с его исследованием.

Определение таблицы для загрузки

Укажите таблицу или класс объектов, который содержит данные, которые нужно конвертировать, на странице мастера Добро пожаловать. Если у вас есть готовая конфигурация загрузки данных, которая может послужить основой для этой операции, вы можете импортировать эту информацию в мастер.

Конфигурации загрузки данных можно импортировать в мастер только из текущего исследования. Вы можете копировать конфигурации загрузки данных из другого исследования, в том числе из другого проекта, и импортировать их информацию.

  1. Щёлкните кнопку Обзор Открыть рядом с текстовым полем Основная таблица.
  2. В появившемся диалоговом окне найдите и щелкните таблицу или класс объектов, который содержит данные для загрузки в граф знаний исследования, затем щелкните OK.
  3. Если у исследования есть конфигурация загрузки данных с соответствующей информацией по импорту текущих данных таблицы, щелкните ниспадающую стрелку Конфигурация загрузки данных, а затем соответствующую конфигурацию загрузки данных Загрузить конфигурацию.
  4. Щелкните Далее, чтобы перейти на следующую страницу мастера Элементы.
Подсказка:

Исходная таблица или класс объектов и исходная конфигурация загрузки данных также могут заданы с помощью кнопок на вкладке Загрузить таблицу на ленте. Вы можете поменять эти настройки в любой момент, но при этом вы потеряете все настройки, которые были заданы в мастере ранее.

Задание элементов для создания графа знаний

Идентифицировать поля в исходной таблице или классе объектов, где данные представляют элементы графа знаний. Поля исходной таблицы перечислены в столбце Column Name таблицы.

Например, если исходная таблица описывает сотрудников организации, вы можете импортировать эту информацию в граф знаний и создать элемент Сотрудник для каждой строки в таблице. Поле, которое вы выбрали для представления элемента, должно быть уникальным идентификатором, например, идентификационным номером сотрудника для типа элемента Сотрудник. Другие свойства, например, полное имя сотрудника, не обязательно будут уникальными

Некоторые таблицы могут содержать информацию о сотрудниках для разных офисов. После импорта одной таблицы при подготовке к импорту второй таблицы вы должны иметь в виду сотрудников, которые появились в нескольких таблицах, например, региональных менеджеров продаж. Если вы импортируете обе таблицу без указания того, как выполнить слияние элементов, то в результате в графе знаний появятся два элемента для одного и того же регионального менеджера продаж. Вы можете избежать создания дубликатов, если в таблице есть данные, которые уникально определяют элемент, и если у существующих элементов в графе знаний есть свойство, содержащее ту же информацию.

Если вы выбираете слияние элементов, то процесс загрузки данных будет сравнивать идентификационный номер сотрудника, который хранится в поле таблицы, со свойством идентификатора типа элемента Сотрудника для каждого существующего экземпляра Сотрудника в графе знаний. Если элемент того же типа с тем же идентификатором существует в графе знаний, то данные из таблицы хранятся в или связаны с существующим элементом графа знаний вместо того, чтобы создавать новый экземпляр. Это значит, что для элементов в таблице и элементов в графе знаний выполняется слияние.

Вообще говоря, лучше выполнять слияние элементов в ходе процесса загрузки данных, если это возможно. Даже если можно выполнить слияние множества элементов, ошибки или пробелы в таблице или графе знаний могут не дать выполнить слияние для нескольких элементов. В этой ситуации вы можете выполнить слияние элементов вручную после того, как процесс загрузки таблицы будет завершен.

Более подробно о слиянии элементов

  1. Проверьте столбец Create Entity для каждого поля в таблице, где данные уникально идентифицированы как элементы.
  2. Для каждого отмеченного поля щелкните в столбце Entity Type и определите тип элемента, для которого создаются новые экземпляры в графе знаний.
    • Для типа элемента, который уже был определен в графе знаний, щелкните появившуюся ниспадающую стрелку и затем на тип элемента в списке. Начните печатать в текстовом окне, чтобы активировать автозаполнение существующего имени типа элемента.
    • Чтобы определить новый тип элемента в графе знаний, щелкните в текстовом окне и укажите имя для нового типа элемента. Новые типы элементов идентифицируются звездочкой в мастере. Используйте существующие типы элементов, где возможно.
    • Если поле в исходной таблице определяет тип элемента, который нужно создать, щелкните появившееся ниспадающее меню и затем опцию Столбец внизу ниспадающего списка. Список изменится, в нем будут показаны все поля таблицы. Щелкните поле, данные которого определяют тип элемента, который нужно создать в графе знаний.
  3. Для каждого отмеченного поля поставьте отметку в столбце Merge, чтобы сравнить данные в таблице с существующими элементами в графе знаний и выполнить слияние элементов, если это возможно.

    Если уникальный идентификатор в таблице не соответствует уникальному свойству элемента в графе, то новый экземпляр элемента создается в графе знаний.

  4. Щелкните Далее, чтобы раскрыть страницу Отношения в мастере.
Подсказка:

В любое время вы можете сохранить правила, которые вы определили как конфигурацию загрузки данных в исследовании. На вкладке Загрузить таблицу на ленте в группе Конфигурация щеклните Сохранить. Щелкните Сохранить Сохранить или Сохранить как Сохранить как и сохраните правлиа в новую или существующую конфигурацию загрузки данных. Поскольку исследование и конфигурация загрузки данных сохранены в проекте, ваши изменения не будут сохранены полностью, пока вы не сохраните также сам проект.

Настройка отношений для их создания в графе знаний

Вы можете задать отношения между элементами с помощью данных в исходной таблице или классе объектов. Чтобы создать отношения как часть процесса загрузки данных, и элемент-источник, и элемент-назначение в отношениях должны быть заданы на странице мастера Элементы. Отношения описываются в одном направлении от элемента-источника к элементу-назначению.

Например, в таблице ,которая описывает сотрудников организации, какое-то поле может определять руководителя этих сотрудников. Вы можете задать тип отношений WorksFor для сбора связностей между сотрудниками и их руководителем. В отношении WorksFor и элемент-источник, и элемент-назначение могут иметь тип элемента Employee. Поскольку обрабатывается каждая строка в таблице, текущий сотрудник является элементом-источником для отношения, а его руководитель является элементом-назначением этого отношения.

Как и в случае с элементами, для заданного в таблице отношения можно настроить слияние с существующими отношениями в графе знаний. При слиянии отношений процесс загрузки данных будет сравнивать элементы таблицы с существующими элементами в графе знаний, а затем определять, можно ли выполнить слияние элементов источников и назначений. Если слияние возможно, то граф знаний будет проверен на предмет, используется ли отношение того же типа, которое уже существует между элементами, если так, что для отношения также будет выполнено слияние. Например, если можно выполнить слияние для элемента-источника, а для элемента-назначения нельзя, то создается новое отношение от имеющегося элемента-источника к новому элементу-назначению.

Вообще говоря, лучше всего выполнять слияние отношений в ходе процесса загрузки данных, если это возможно. Как и в случае с элементами, ошибки или пробелы в таблице или в графе знаний могут не дать выполнить слияние для отношений. Вы можете выполнить слияние отношений вручную после того, как процесс загрузки данных будет завершен.

Более подробно о слиянии отношений

  1. Щелкните пустую строку внизу таблицы, чтобы задать новое отношение.
  2. Щелкните в столбце Origin Entity, затем появившуюся ниспадающую стрелку и тип элемента, заданный на странице Элементы, который является источником для этого отношения.
  3. Щелкните столбец Relationship Type и задайте тип отношений, для которого будут созданы новые экземпляры в графе знаний.
    • Для типа отношения, который уже был определен в графе знаний, щелкните появившуюся ниспадающую стрелку и затем на тип отношения в списке. Начните печатать в текстовом окне, чтобы активировать автозаполнение существующего имени типа отношения.
    • Чтобы определить новый тип отношения в графе знаний, щелкните в текстовом окне и укажите имя для нового типа отношения. Новые типы отношений идентифицируются звездочкой в мастере. Используйте существующие типы отношений, где возможно.
    • Если поле в исходной таблице определяет тип отношения, который нужно создать, щелкните появившееся ниспадающее меню и затем опцию Столбец внизу ниспадающего списка. Список изменится, в нем будут показаны все поля таблицы. Щелкните поле, данные которого определяют тип отношения, которое нужно создать в графе знаний.
  4. Щелкните в столбце Destination Entity, затем появившуюся ниспадающую стрелку и тип элемента, заданный на странице Элементы, который является назначением для этого отношения.
  5. Поставьте отметку в столбце Merge, чтобы сравнить данные в таблице с существующими элементами и отношениями в графе знаний и выполнить слияние элементов и отношений, если это возможно.
  6. Щелкните Далее, чтобы перейти на следующую страницу мастера Свойства.

Задание свойств для создания графа знаний

Данные из исходной таблицы можно сохранить в свойствах элементов и отношений в графе знаний. Для этого вам предлагается несколько списков информации. Есть список всех полей в исходной таблице или классе объектов, список элементов, заданных на странице Элементы в мастере, а также список всех отношений, заданных на странице Отношения в мастере.

  • Список Имена столбцов разделен на две части: Неиспользуемые и Используемые поля. Поля, которые идентифицируют элементы, заданные на странице Элементы, являются используемыми. Оставшиеся поля таблицы появятся в списке неиспользуемых полей.
  • В списке Элементы тип элемента заключен в скобки, за ним следует имя поля. Например, если в поле ID таблицы хранится номер сотрудника, который уникально описывает элемент Employee, то в списке это будет выглядеть так: (Employee) ID.
  • В списке Отношения каждая запись показывает исходный элемент отношения, тип отношений и элемент назначения. Например, если источник и назначения являются элементом Employee, а WorksFor - это тип отношения, то в списке будет: (Employee) ID WorksFor (Employee) ID.

Три списка выше используются для определения правил для конвертации исходных данных таблицы в свойства элементов и отношений. Когда вы выбираете элемент или отношение, то в таблице Свойства будут показаны уже данные правила.

По умолчанию у каждого элемента есть правило для сохранения данных из поля, которое уникального описывает его для свойства в графе знаний. У этого правила есть значок блокировки Заблокированное свойство в строке в таблице Свойства, его нельзя удалить без изменения того, как задан элемент. Если нет прямого сопоставления между именем поля и именем свойства, то у элемента появится значок красного восклицательного знака Ошибка рядом с ним в списке Элементы. Правило в таблице Свойства также будет учитываться как недопустимое. Обновите правило, чтобы идентифицировать допустимое имя свойства. Вы не можете запустить операцию загрузки данных, пока не исправите эту ошибку.

  1. Первый элемент в списке Элементы выбран по умолчанию, а правило, которое определяет этот элемент, появляется в таблице Свойства. Продолжайте работать с этим элементом или выберите другой элемент графа.
  2. Щелкните на пустой строке в нижней части таблицы Свойства.
  3. Щелкните в столбце Property Name и укажите свойство для выбранного элемента графа.
    • Для свойства, которое уже было задано в графе знаний, щелкните появившуюся ниспадающую стрелку, а затем щелкните свойство в списке. Начните печатать в текстовом окне, чтобы активировать автозаполнение существующего имени типа свойства.
    • Чтобы определить новое свойство в графе знаний, щелкните в текстовом окне и укажите имя для нового свойства. Новые свойства идентифицируются звездочкой в мастере. Используйте существующие свойства, где возможно.
  4. Для существующих свойств в столбце Data Type появляется тип данных. Для нового свойства щелкните ниспадающую стрелку и затем соответствующий тип данных.
  5. Щелкните в столбце Property Value и задайте правило для хранения данных в свойстве элемента графа.
    • Щелкните появившуюся ниспадающую стрелку и затем щелкните поле в таблице, чьи данные будут храниться в графе знаний. Поле будет перемещно из Неиспользуемых в используемые в списке Имена полей.
    • Тип значения в текстовом окне, который будет сохранен в этом свойстве для всех элементов графа, заданных в таблице. Значение будет проверено на предмет типа данных свойства, если для свойства типа целое задан текст, то значение не будет сохранено.
  6. Отметьте столбец Use For Merge, чтобы включить это свойство при сравнении данных в таблице с существующими элементами графа в графе знаний, чтобы определить, можно ли выполнить их слияние.

    Выполняется слияние элементов, если все идентифицируемые поля и свойства совпадают. Новые элементы создаются при отсутствии возможностей слияния.

  7. Выберите другой элемент графа в списке Элементы или Отношения и задайте дополнительные правила для конвертации данных из исходной таблицы в свойства элемента графа в графе знаний.
  8. Щелкните Далее, чтобы перейти на следующую страницу мастера Пространственный.
Примечание:

Вы можете перетащить поле из списка Имена столбцов в таблицу Свойства. Поле автоматически появится в столбце Property Value. Если имя поля и имя свойства совпадают, то имя свойства автоматически появляется в столбце Property Name. Если имя поля и имя свойства не совпадают, то имя поля появится в столбце Property Name, как имя нового свойства, которое будет создано для элемента графа.

Задание пространственных объектов для элементов

Идентифицировать поля в исходной таблице или классе объектов, где данные представляют элементы графа знаний. Элементы, заданные на странице Элементы в мастере, перечислены в столбце таблицы элемент.

Для графов знаний поддерживается только система координат WGS84. Предполагается что все объекты и координаты используют эту систему координат.

  1. Отметьте столбец Create Spatial для каждого элемента, если данные в таблице можно использовать для задания пространственного объекта.

    Для имеющихся элементов в столбце Geometry Type появляется тип данных.

  2. Для новых отмеченных элементов со звездочкой рядом с именем щелкните ниспадающую стрелку и затем соответствующий тип геометрии.

    Пространственные объекты хранятся в свойстве элемента, указанном в столбце Spatial Property Name. Имя свойства изменить невозможно.

  3. Для каждого отмеченного элемента определите, как будет создаваться его пространственный объект. Щелкните на элементе в таблице. Под таблицей появится ниспадающий список Входной пространственный формат. Щелкните ниспадающий список и затем соответствующую опцию для пространственных данных, которые хранятся в исходной таблице или классе объектов.
    • Геометрия — форма, которая хранится в поле геометрии исходного класса объектов, будет сохранена в элементе в графе знаний. Используйте появившийся ниспадающий список Входное поле геометрии, чтобы идентифицировать поле геометрии. В графе знаний можно хранить только поля, хранящие формы, заданные в формате геометрии ArcGIS.
    • Координаты — пространственный объект элемента будет построен на основе данных в таблице. Укажите поля, содержащие координаты объекта. Поля в исходной таблице появятся в списке Доступные поля. Для каждого поля, которое хранит пространственные координаты, щелкните на поле и затем Добавить; поле будет добавлено в список Выбранные поля.
  4. Щелкните Далее, чтобы перейти на следующую страницу.

    Если для графа знаний включено происхождение, мастер перейдет на страницу Происхождение. В противном случае он перейдет на страницу Просмотреть и запустить.

Задание записей происхождения для значений свойства

Вы можете создавать записи происхождения, чтобы определить, откуда взялись данные в графе знаний, если эта возможность включена для вашего графа знаний.

Все свойства элементов и отношений, заданные на страницах Элементы и Отношения мастера, перечислены в верхней части страницы Происхождение. Вы можете создавать записи происхождения, чтобы задать источник значений, хранящихся в этих свойствах.

Записи о происхождении могут связывать значения свойств с исходной информацией, хранящейся в поле используемой вами таблицы. Вы также можете ввести URL-адрес, путь к файлу или текст, описывающий исходный материал для набора значений свойства. Например, если все значения какого-то свойства взяты с одного и того же веб-сайта, вы можете создать запись происхождения для каждого значения, которое ссылается на URL-адрес веб-сайта. Если вы используете информацию в таблице для создания новых элементов типа Документ, вы также можете создавать записи происхождения, ссылающиеся на эти документы.

Если в графе знаний уже есть записи о происхождении, их можно использовать в качестве шаблонов для новых записей о происхождении. Например, другие данные, которые ранее были загружены в граф знаний, могли быть получены с того же веб-сайта. Используя существующую запись о происхождении в качестве шаблона, вы можете избежать орфографических ошибок и обеспечить согласованность записей о происхождении, созданных в разное время.

Выберите одно или несколько свойств в таблице Свойства Элемент/Отношение. В приведенной ниже таблице Происхождение определите, как будут создаваться записи происхождения для каждого значения в каждом выбранном свойстве.

  1. Выберите свойство в таблице Свойства Элемент/Отношение.

    Тип элемента или отношения отображается в столбце Entity/Relationship, а свойство - в столбце Property.

    • Щелкните строку, чтобы выбрать описываемое ей свойство.
    • Нажмите клавишу Shift, щелкнув другую строку в списке, чтобы выбрать несколько свойств, описанных в соседних строках таблицы.
    • Нажмите клавишу Ctrl, щелкнув на других строках в списке, чтобы выбрать определенные свойства, которые не находятся рядом друг с другом в таблице.
  2. Щелкните пустую строку в таблице Происхождение внизу страницы, чтобы задать новую запись о происхождении.
  3. Щелкните столбец sourceType и задайте тип исходной информации в появившемся элементе управления.

    Поддерживаются три типа источников. Источником записи происхождения может быть документ графа знаний, веб-сайт или файл, идентифицированный URL-адресом или путем к файлу, или текст, который определяет исходный материал или способ доступа к нему.

    • Опция Значения выбрана по умолчанию в нижней части элемента управления. Щелкните Document, URL и String. У каждой записи происхождения будет один и тот же тип в свойстве типа источника.
    • Щелкните параметр Столбец в нижней части элемента управления, если тип источника задан в поле таблицы. Элемент управления изменится, и в нем будут показаны все поля таблицы. Щелкните поле, данные которого определяют исходный тип записи происхождения. У каждой записи происхождения будет тип источника в выбранном поле для соответствующей строки таблицы.
  4. Щелкните столбец source и задайте источник записи происхождения в появившемся элементе управления.
    • Опция Значения выбрана по умолчанию в нижней части элемента управления. Если источником является URL-адрес или текст, который используется в других записях происхождения графа знаний, введите часть значения. В графе знаний выполняется поиск существующих записей происхождения и выводятся все соответствующие источники. Наведите курсор на значение в списке результатов поиска, чтобы изучить свойства существующей записи происхождения. Щелкните нужное значение в списке. Существующая запись происхождения используется в качестве шаблона — источник и все остальные столбцы таблицы Происхождение автоматически заполняются для этой записи происхождения. У всех записей происхождения будет один и тот же текст в свойстве источника.
    • Если источником является URL-адрес или текст, который не использовался в других записях происхождения, введите новое значение. В существующих записях происхождения был выполнен поиск, но совпадающих значений не было обнаружено. Щелкните кнопку Новое происхождение внизу элемента управления. У всех записей происхождения будет один и тот же текст в источнике.
    • Щелкните параметр Столбец в нижней части элемента управления, если источник задан в таблице. Элемент управления изменится, и в нем будут показаны все поля таблицы. Щелкните поле, данные которого определяют исходную запись происхождения. У каждой записи происхождения будет источник в выбранном поле для соответствующей строки таблицы.
    • Если на странице Элементы определены новые элементы типа Документ и источником является один из этих документов, выберите опцию Элементы в нижней части элемента управления. Элемент управления изменится, и будет показан список всех новых элементов типа Документ, заданных в таблице Свойства Элемент/Отношение. Щелкните элемент документа, который определяет исходную запись происхождения. Каждая запись происхождения будет ссылаться на соответствующий объект Документ в качестве источника.
  5. При необходимости щелкните столбец sourceName и задайте заголовок источника в появившемся элементе управления.
    • Опция Значения выбрана по умолчанию в нижней части элемента управления. Если было указано значение шаблона и вы хотите его использовать, пропустите этот шаг. Либо введите новый заголовок. У всех записей происхождения будет один и тот же текст в свойстве названия источника.
    • Щелкните параметр Столбец в нижней части элемента управления, если заголовок для поля задан в таблице. Элемент управления изменится, и в нем будут показаны все поля таблицы. Щелкните поле, данные которого задают заголовок. У каждой записи происхождения будет имя источника в выбранном поле для соответствующей строки таблицы.
  6. При необходимости щелкните столбец comment и укажите дополнительную информацию об исходном материале в появившемся элементе управления.

    Следуйте той же процедуре, которая использовалась для поля sourceName.

  7. При необходимости нажмите Изменить схему Настройки, чтобы добавить пользовательские свойства для записей происхождения в графе знаний.
    1. В появившемся виде полей щелкните пустую строку внизу таблицы.
    2. Укажите имя нового свойства и задайте его тип данных.
    3. На вкладке Поля ленты, в группе Управление изменениями щелкните Сохранить.
    4. Закройте вид поля.

    Свойства новой записи происхождения появятся в таблице Происхождение.

  8. Для любых других свойств записи происхождения, которые появляются в таблице Происхождение, задайте соответствующие значения.

    Следуйте той же процедуре, которая использовалась для поля sourceName.

  9. Щелкните Далее, чтобы перейти к дополнительной странице мастера Просмотреть и запустить.

Просмотр конфигурации и загрузка данных

Страница мастера Просмотреть и запустить показывает суммарную информацию по элементам, отношениям и свойствам, которые будут созданы в графе знаний. Кнопка Запустить будет недоступна, пока не будут исправлены все проблемы, обнаруженные в мастере.

  1. Посмотрите все правила для загрузки данных из исходной таблицы или класса объектов для элементов, отношений, свойств и пространственных объектов в графе знаний.
  2. Чтобы сохранить итоговый набор правил для последующего использования, поставьте отметку Сохранить конфигурацию. Щелкните ниспадающую стрелку для появившегося списка и щелкните на названии существующей конфигурации загрузки данных, чтобы перезаписать ее. Либо укажите имя для хранения правил в новой конфигурации загрузки данных.
  3. Поставьте отметку для опции Отобразить результаты в новой Диаграмме связей по завершению, чтобы добавить элементы и отношения, созданные процессом конвертации данных в новую диаграмму связей для просмотра.
  4. Щелкните Запустить Запустить.

    Если в ходе процесса загрузки данных будут обнаружены какие-то ошибки, то внизу страницы появится предупреждение. Щелкните ссылку Просмотреть детали в предупреждении, чтобы отобразить список ошибок в диалоговом окне. Например, нулевое значение в таблице или свойстве, либо несовпадение типов данных не дает выполнить слияние двух элементов, в результате чего появляется ошибка.

    Чтобы сохранить этот список и просмотреть его позднее, когда вы оцените результаты процесса конвертации, щелкните кнопку Копировать Копировать. Откройте текстовый редактор и вставьте скопированные сообщения, а затем сохраните их в текстовый файл.

  5. Закройте вид Загрузить таблицу.