Панель Извлечь местоположения

Дополнительный модуль ArcGIS LocateXT позволяет вам использовать панель Извлечь местоположения для поиска в неструктурированных данных любых пространственных местоположений и создания точечных объектов, представляющих эти местоположения.

Неструктурированные данные – это любой текст или документ, включая веб-страницы, отчеты, электронные сообщения, социальные сети и др. Также можно обрабатывать документы Microsoft Office (Word, PowerPoint и Excel), документы Adobe PDF, текстовые файлы и многое другое. Панель Извлечь местоположения может обрабатывать множество папок и файлов одновременно, или сканировать весь диск. Вы также можете перетаскивать текст из электронной почты или веб-страницы непосредственно на панель для анализа.

Каждая точка выходного класса объектов имеет запись в таблице атрибутов, указывающую на файл, в котором было найдено пространственное местоположение. Текст, окружающий пространственное местоположение, также извлекается из оригинального документа и сохраняется в атрибутах, чтобы обеспечить контекст для этого местоположения. Даты и ключевые слова, связанные с местоположением, тоже можно извлечь. Панель Извлечь местоположения не распознает текст, представляющий адрес, как пространственное местоположения автоматически, и поэтому не может использовать локатор для получения точки, представляющей это местоположение.

Такие же возможности, что и в панели Извлечь местоположения, также доступны в инструментах геообработки Извлечь местоположения из документа и Извлечь местоположения из текста.

Пример произвольного текста

Если вы, например, просматриваете новостные статьи о землетрясениях на Аляске и хотите увидеть все местоположения, которые упомянуты в статье, на карте, то приведенный ниже образец входного текста можно скопировать и вставить непосредственно в панель.

Входной текст

На Аляске происходит в среднем 100 землетрясений в день. В тектонике региона преобладает взаимодействие Тихоокеанской и Североамериканской плит. Это взаимодействие привело к трем крупнейшим землетрясениям, которые когда-либо регистрировались в истории. Самое крупное из этих землетрясений мощностью 9.2 по шкале Рихтера, произошло в Принс Уильям Саунд (60,91 ° с.ш., 147,34 ° з.д.) 28 марта 1964 г. Второе по мощности землетрясение на Аляске мощностью 8.7 баллов, случилось 4 февраля 1965 г. недалеко от Островов Крысы (51,25 ° с.ш., 178,72 ° в.д.). Третье, мощностью 8.6, произошло 9 марта 1957 года, вблизи Андреяновских островов (51.50 ° с.ш., 175,63 ° з.д.).

Выходные объекты

После того, как местоположения трех землетрясений были извлечены из входного текста, выходной класс объектов появится на панели Содержание, и точки будут видны на активной карты.

Извлеченные местоположения землетрясений на Аляске

По умолчанию все найденные во входном тексте даты, относящиеся к относительно недавнему периоду времени, также извлекаются и записываются в таблицу атрибутов выходного класса пространственных объектов. Однако даты во входном тексте выше выходят за пределы диапазона дат по умолчанию.

Примечание:

Некоторые международные форматы пространственных координат и международные форматы дат не распознаются по умолчанию, когда они встречаются во входном тексте. Например, в случаях, когда пространственная координата использует аббревиатуры направлений, переведенные на языки, отличные от английского, и когда даты не представлены в формате ISO, а написаны на языке, отличном от английского. Настройки могут быть оптимизированы для правильного распознавания координат и дат на других языках вместо или в дополнение к английскому языку.

Пример частично структурированного текста

Кроме распознавания пространственных координат, можно также определять пользовательские местоположения, которые связаны с местоположениями с пространственными координатами. Например, если где-либо в документе найдено слово Портланд, то точка, представляющая местоположение в городе, может быть связана с этим словом. Таким же образом, если найден код (аббревиатура) аэропорта, то точка, представляющая местоположение аэропорта, может быть связана с этим кодом.

Некоторые документы имеют некоторую степень структурированности. Если у вас есть папка, содержащая формы, связанные с поездками, из них можно извлечь информацию, которую можно сохранить в пользовательских атрибутах в таблице атрибутов выходного класса объектов. Например, для документа, содержащего текст, приведенный ниже, можно определить пользовательские атрибуты, которые извлекают текст, следующий за этими надписями Name, Address и Purpose. Далее эти атрибуты можно обработать, используя другие инструменты, доступные в ArcGIS AllSource.

Входной текст

Name: Doe, Jane

Address: 380 New York St, Redlands, CA, 92373

Date: 2019-03-14

Destination: PDX

Purpose: Встреча с коллегами в Esri R&D Center по адресу 309 SW 6th Ave #600, Portland, OR, 97204.

Выходные объекты

После того как местоположения в Портланде будут извлечены из входного текста, выходной класс объектов появится на панели Содержание, и точки будут видны на активной карты.Извлеченные местоположения землетрясений на Аляске Нажимайте объекты, чтобы изучить информацию, извлеченную из документа. В данном примере, даты были извлечены и сохранены в таблице атрибутов. Пользовательские атрибуты можно также использовать для извлечения текста от конца надписи до конца строки, и хранить это содержание в полях, представляющих имя и адрес путешественника, а также цель его поездки. Дополнительные пользовательские атрибуты используются для поиска существующих в документе ключевых слов и сохранения их в другом поле.

Извлеченные местоположения в Портланде

Содержание поля Address в таблице атрибутов выходного класса объектов можно геокодировать, используя другие инструменты; оно не будет геокодировано автоматически. Таким же образом, адрес, хранящийся в формате произвольного текста и описывающий цель поездки, не будет автоматически идентифицирован, как адрес, и геокодирован.

Примечание:

Если у вас есть структурированные текстовые данные, например, текстовый файл с разделителями-запятыми, где координаты x, y хранятся в отдельных столбцах таблицы, используйте инструмент Таблица XY в точки для создания точечных объектов, соответствующих этим местоположениям.