В качестве элемента дополнительного модуля ArcGIS LocateXT, панель Извлечь местоположения ArcGIS AllSource позволяет сканировать документы и тексты и находить пространственные координаты и пользовательские местоположения. Откройте карту, в которую вы планируете добавить найденные местоположения. Точки, представляющие местоположения, хранятся в классе объектов и добавляются на активную карту в виде слоя.
Откройте панель Извлечь местоположения
Карта должна быть активной в ArcGIS AllSource, чтобы могла быть открыта панель Извлечь местоположения.
- Создайте или откройте карту. Например, на вкладке Карта в группе Вставка щелкните Новая карта.
- На вкладке Данные в группе Импорт щелкните Извлечь местоположения .
Появится панель Извлечь местоположения.
Извлечь местоположения
На панели Извлечь местоположения на вкладке Извлечь можно указать следующее:
- Файлы, папки или текст, который будет просканирован для поиска местоположений
- Имя слоя карты и выходного класса пространственных объектов, которые будут созданы или обновлены
- Система координат выходного класса пространственных объектов при его создании
При каждом извлечении местоположений из документов или текста можно выбрать, создается ли новый класс пространственных объектов и добавляется ли новый слой к активной карте, обновляется ли существующий слой карты и класс пространственных объектов или перезаписывается существующий класс пространственных объектов
Добавление нового слоя на карту
Создается класс объектов, в котором будут храниться извлеченные местоположения. В активной карте создается слой карты для отображения содержания класса объектов.
- Откройте панель Извлечь местоположения .
- Укажите имя для нового слоя карты и класса пространственных объектов, которые будут созданы, выполнив одно из следующих действий:
- Введите имя нового слоя карты и класса пространственных объектов в поле Имя. Новый класс пространственных объектов создается с этим именем в базе геоданных проекта по умолчанию.
- Щелкните кнопку Обзор и в диалоговом окне Новый класс пространственных объектов перейдите к местоположению, в котором хотите создать класс пространственных объектов или шейп-файл. Введите имя нового элемента в текстовом поле Имя и щелкните Сохранить.
Внимание:
При выборе существующего класса пространственных объектов вместо указания имени нового класса, на панели Извлечь местоположения появится предупреждение. Существующий класс пространственных объектов будет удален, и создается новый класс пространственных объектов с тем же именем. Это может повлиять на другие карты.
- Щелкните ниспадающий список Система координат или кнопку Выбрать систему координат и выберите систему координат, которую вы хотите использовать для выходного класса объектов.
Система координат входных объектов указывается независимо, на вкладке Координаты и в файле пользовательских местоположений. Найденные местоположения преобразуются в систему координат выходного класса объектов.
- Щелкните вкладку Файлы и папки и укажите любые элементы, в которых необходимо найти местоположения.
- Перетащите файлы и папки из Windows Explorer на вкладку.
- Щелкните Обзор и в диалоговом окне Добавить файлы и папки найдите и выберите соответствующие файлы или папки и щелкните ОК. Щелкните Добавить еще, чтобы добавить в список другие файлы и папки.
- Щелкните вкладку Текст и укажите текст, в котором необходимо найти местоположения.
- Скопируйте текст из документа, сообщения электронной почты или веб-страницы и поместите его на вкладку.
- Выберите текст для сканирования в документе, электронной почте или на веб-странице и перетащите его в ArcGIS AllSource и на вкладку.
- Щёлкните Извлечь.
Выполнение процесса можно отменить в любой момент. Когда процесс будет завершен, внизу панели появится сообщение, информирующее, был ли процесс успешным.
Будет создан указанный класс объектов, и найденные местоположения будут сохранены в классе объектов в виде точек. Слой карты, ссылающийся на класс объектов, будет добавлен на активную карту. Если в документе или тексте не было найдено местоположений, класс объектов и слой карты будут пустыми.
Примечание:
Если вы решили перезаписать существующий класс пространственных объектов, который ранее был добавлен на карту, то будет создан и добавлен новый слой карты, который будет ссылаться на новый класс пространственных объектов.
Чтобы извлечь местоположения из другого набора документов или текста, скопированного из другого расположения, щелкните Очистить все входные данные в нижней части вкладки Извлечь. Все файлы будут удалены из списка на вкладке Файлы и папки и весь текст будет удален на вкладке Текст. Укажите новый набор элементов для обработки.
Обновление существующего слоя на карте
Вы можете последовательно добавлять местоположения в существующий класс объектов. Например, каждую неделю вы можете обрабатывать новый набор отчетов и добавлять местоположения из этих файлов в существующий набор. Или, после обработки некоторого набора документов, когда вы довольны результатом, вы можете обработать дополнительные документы и добавить эти дополнительные местоположения в существующий класс объектов.
- Откройте панель Извлечь местоположения.
- Щелкните ниспадающий список Имя и выберите существующий слой карты для обновления.
Местоположения, извлеченные из документов и текста, будут добавлены в существующий класс объектов, на который ссылается данный слой карты. Элементы управления, используемые для задания системы координат выходного класса пространственных объектов, будут отключены.
- Щелкните вкладку Файлы и папки и укажите любые элементы, в которых необходимо найти местоположения.
- Щелкните вкладку Текст и укажите текст, в котором необходимо найти местоположения.
- Щёлкните Извлечь.
Панель Сопоставление полей появится на панели Извлечь местоположения.
- Укажите поле в таблице атрибутов существующего слоя, в котором будет храниться информация, извлеченная из документов или текста.
Полный набор полей, которые могут быть заполнены в выходном классе объектов, описан ниже.
- Если ни одно из полей в существующем классе объектов не может хранить извлеченную информацию, щелкните Назад и выберите другой выходной слой, или создайте вместо этого новый слой.
- Когда вы удовлетворены соответствием между полями существующего слоя и полями, содержащими информацию, извлеченную из документов и текста, нажмите OK.
Выполнение процесса можно отменить в любой момент. Когда процесс будет завершен, внизу панели появится сообщение, информирующее, был ли процесс успешным.
Если при сканировании документов и текста были найдены местоположения, то они будут добавлены в указанный класс объектов. Существующий слой карты и его таблица атрибутов будут обновлены таким образом, чтобы отобразить эти новые местоположения.
Просмотр извлеченных местоположений
После сканирования документов и текста и создания выходного класса объектов, на карту будет добавлен выходной слой карты, и он будет выбран на панели Содержание. Щелкните найденное местоположение, чтобы узнать о нем дополнительную информацию. Во всплывающем окне отображается извлеченное местоположение, документ, из которого оно было извлечено, и вся дополнительная информация, извлеченная из документа в связке с указанным местоположением, для понимания контекста. Откройте таблицу атрибутов слоя, чтобы сравнить и изучить все найденные местоположения. В ходе оценки данных можно удалять местоположения за пределами интересующей вас области или экспортировать подмножество местоположений, представляющих для вас особый интерес.
Панель Извлечь местоположения использует различные настройки по умолчанию для распознавания основных и часто упоминаемых местоположений. Когда вы лучше поймете специфику местоположений, встречающихся в ваших данных, вы сможете изменить эти настройки на вкладке Свойства, чтобы извлекать дополнительные местоположения или более подробную информацию в выходные поля.
Более подробно о настройках, используемых для извлечения местоположений и атрибутов
Определения выходных полей
При создании нового выходного класса объектов, содержащего извлеченные местоположения, этот класс объектов будет иметь следующие поля по умолчанию и любые дополнительные поля, определенные в файле пользовательских атрибутов.
Более подробно о пользовательских файлах атрибутов
Имя поля | Псевдоним поля | Тип данных | Описание |
---|---|---|---|
Name | Имя | Текст — 50 символов, по умолчанию | Имя обрабатываемого файла или Text для указания того, что текст был обработан. Размер управляется настройками на вкладке Выходные данные. |
Pre_Text | Текст до | Текст 254 символа, по умолчанию | Фрагмент файла или текста, предваряющий найденное местоположение. Размер управляется настройками на вкладке Выходные данные. |
Ext_Text | Извлеченный текст | Текст — 120 символов, по умолчанию | Местоположение, которое было найдено, как оно было найдено в файле или тексте, например, 52,825°северной широты, 169,944°Западной долготы для пространственной координаты, или LAX для пользовательского местоположения, которое связывает код аэропорта с пространственной координатой. Размер управляется настройками на вкладке Выходные данные. |
Ext_Type | Извлеченный тип | Текст — 50 символов, по умолчанию | Тип найденного местоположения, например, координата в десятичных градусах. Когда пользовательское местоположение найдено, то записывается местоположение, определенное в пользовательском файле местоположений, которое было сопоставлено. Размер управляется настройками на вкладке Выходные данные. |
Post_Text | Текст после | Текст 254 символа, по умолчанию | Фрагмент файла или текста, следующий за найденным местоположением. Размер управляется настройками на вкладке Выходные данные. |
Precision | Точность (м) | Long | Для пространственных координат, уровень точности на поверхности земли, до которого местоположение является точным, в метрах. Например, координата в десятичных градусах со множеством знаков после запятой будет более точной и будет иметь меньшее расстояние. Для пользовательских местоположений, число букв, которые не совпадают при сравнении оригинального текста с сопоставленным местоположением. Если нечеткое сопоставление отключено, то необходимо точное соответствие и значение будет равно 0. Если оно включено, и неправильно названное местоположение Redalnds сопоставлено Redlands, то значение будет равно 2. |
Std_Coord | Стандарт. Коорд. | Текст — 30 символов | Стандартизированная версия извлеченного местоположения, например, 52.825000N 169.944000W. Формат для координаты управляется настройками на вкладке Выходные данные. |
First_Date | Первая дата | Дата | Первая дата, найденная в файле или в тексте, если производится извлечение дат. В противном случае, поле содержит пустые значения. Даты извлекаются только в том случае, если они попадают в диапазон, указанный на вкладке Выходные данные, и дата не установлена на возможность пропуска, и ограничение на количество извлеченных дат не было достигнуто. |
Early_Date | Самая ранняя дата | Дата | Самая старая дата, найденная в файле или в тексте, если производится извлечение дат. В противном случае, поле содержит пустые значения. Даты извлекаются только в том случае, если они попадают в диапазон, указанный на вкладке Выходные данные, и дата не установлена на возможность пропуска, и ограничение на количество извлеченных дат не было достигнуто. |
Late_Date | Самая поздняя дата | Дата | Самая недавняя дата, найденная в файле или в тексте, если производится извлечение дат. В противном случае, поле содержит пустые значения. Даты извлекаются только в том случае, если они попадают в диапазон, указанный на вкладке Выходные данные, и дата не установлена на возможность пропуска, и ограничение на количество извлеченных дат не было достигнуто. |
All_Dates | Все даты | Текст 254 символа, по умолчанию | Список всех дат, найденных в тексте, разделенных запятыми, если производится извлечение дат. В противном случае, поле содержит пустые значения. Все даты стандартизированы в формате гггг-мм-дд. Даты извлекаются только в том случае, если они попадают в диапазон, указанный на вкладке Выходные данные, и дата не установлена на возможность пропуска, и ограничение на количество извлеченных дат не было достигнуто. Если список дат, разделенный запятыми, слишком длинный для размера данного поля, список будет усечён. Размер управляется настройками на вкладке Выходные данные. |
ExDateText | Извлеченный Текст Даты | Текст 254 символа, по умолчанию | Даты в том виде, в каком они были найдены в файле или тексте, например, 18 августа 2019 года или 2/3/2020. Если список дат, разделенный запятыми, слишком длинный для размера данного поля, список будет усечён. Размер управляется настройками на вкладке Выходные данные. |
Filename | Имя файла | Текст 254 символа, по умолчанию | Полный путь к обрабатываемому файлу, или пустое значение, если обрабатывается текст. Можно выбрать, какие файлы будут обработаны или пропущены. Размер управляется настройками на вкладке Выходные данные. |
File_Type | Тип файла | Текст — 10 символа, по умолчанию | Формат обрабатываемого файла, или пустое значение, если обрабатывается текст. Вы можете выбрать обработку определенных типов файлов. Размер управляется настройками на вкладке Выходные данные. |
Modified | Изменено (UTC) | Текст 20 символов | Дата и время последнего изменения файла в формате гггг-мм-дд чч:мм:сс. |
Scanned | Отсканировано (UTC) | Текст 20 символов | Дата и время обработки файла в формате гггг-мм-дд чч:мм:сс. |
Оценка результатов
Вы можете не получить желаемые местоположения при первом сканировании документа. Дополнительно к выходному слою карты и классу объектов могут быть созданы два файла журнала: журнал сканирования и журнал некорректных координат. При работе с входным документом, содержание которого вам известно, и число создаваемых в выходном классе объектов местоположений не соответствует числу, которое вы ожидали, файлы журналов помогут вам изучить результаты.
После того, как документы и текст были просканированы, и выходной класс объектов был создан, в нижней части панели Извлечь местоположения появится сообщение об успехе завершения процесса. Сообщение будет содержать ссылки на файлы журналов, которые являются временными. Чтобы сохранить их для дальнейшего исследования, откройте файлы и сохраните их в постоянном местоположении, например, в домашней папке проекта. Дополнительно можно добавить имя слоя карты или класса объектов, к которым относится этот файл журнала.
Журнал сканирования
Щелкните ссылку Просмотреть журнал сканирования, содержащуюся в сообщении внизу панели Извлечь местоположения, чтобы открыть файл журнала сканирования. Для каждого сканированного документа, журнал показывает следующую информацию:
- Имя файла документа и его местоположение на локальном или сетевом компьютере
- Сообщение, описывающее проблему, которая была обнаружена при сканировании документа, если применимо
- Сколько потенциальных местоположений было найдено
- Сколько уникальных дат было найдено
Потенциальное местоположение - это текст, найденный в содержании документа, который похож на пространственную координату или пользовательское местоположение. Если в качестве входных данных используется текст, то в журнал сканирования не записываются имя файла и его расположение, но остальная информация в файле журнала является такой же.
Например, если вы ожидали, что будет извлечено девять местоположений, но в качестве выходных данных было создано только шесть местоположений, журнал сканирования может объяснить, что произошло. В журнале может быть указано, что было найдено только шесть возможных местоположений на основе текущих настроек на панели Извлечь местоположения. Журнал может также показать, что было найдено больше дат, чем ожидалось, — координата может быть интерпретирована как дата. Измените настройки, прежде чем снова пытаться извлечь местоположения из документа.
Журнал недопустимых координат
Журнал недопустимых координат создается в случае, если потенциальное местоположение было оценено и признано некорректным. Щелкните Просмотреть журнал недопустимых координат, чтобы открыть его.
Журнал записей недопустимых координат показывает следующее:
- Документ, в котором было найдено потенциальное местоположение
- Оригинальный текст, который был определен в качестве потенциального местоположения
- Формат координат, который использовался для оценки местоположения
Например, если были найдены координаты широты и долготы, но широта в координате больше 90 градусов, координата считается некорректной. Может оказаться, что потенциальные местоположения в документах были оценены, используя формат координат, отличный от ожидаемого. Измените настройки, прежде чем снова пытаться извлечь местоположения из документа.
Если изучение журнала недопустимых координат не помогает, можно отключить опцию Записать некорректные координаты в журнал на вкладке Координаты , чтобы такие координаты не записывались для используемых вами форматов пространственных координат.