Найти схожие местоположения

Значок инструмента Доступен в аналитике больших данных.

Инструмент Найти схожие местоположения Инструмент Найти схожие местоположения определяет, какой из объектов-кандидатов имеет наибольшее или наименьшее сходство с одним или несколькими базовыми объектами на основе их атрибутов.

Схема рабочего процесса

Схема рабочего процесса Найти схожие местоположения

Примеры

  • Определите, какие из ваших производственных мощностей наиболее похожи на наиболее производительные, исходя из соотношений между значениями их числовых атрибутов.
  • Криминалисту необходимо изучить базу данных по всем преступлениям, чтобы определить, не является ли то или иное недавнее преступление частью закономерности или тренда.
  • Определите другие деревни, которые подвергаются высокому риску заболевания, на основе характеристик деревень, наиболее пострадавших от заболевания.

Примечания по использованию

  • Можно использовать таблицу, точечные, полилинейные или полигональные объекты.
  • Поиск (кандидата) объекта являются обязательным и будет ранжироваться по сходству или различию с эталонными местоположениями.
  • Будет возвращено максимум 10000 объектов.
  • Если в параметре Целевом слое (базовые объекты) существует более одного объекта, совпадение будет основываться на среднем значении базовых объектов. Поэтому, например, если у вас есть два базовых объекта, и одно из Полей анализа является численностью населения, инструмент будет искать значение параметра Присоединяемый слой (объекты поиска кандидатов) с населением, наиболее соответствующим среднему значению. Если значения населения равны 100 и 102, например, инструмент ищет кандидаты со значением около 101.
    Примечание:

    Если в параметре Целевой слой (объекты базового местоположения) существует более одного объекта, выберите Основывать подобие на (анализ полей) атрибутах со сходными значениями. Если, например, объект имеет значение населения 100, а другой – 100 000 жителей, инструмент возьмет среднее от этих значений и будет искать кандидатов с населением около 50050. Это усредненное значение далеко от значения численности населения любого слоя.

  • С помощью параметра Сходство можно искать объекты с наибольшим или наименьшим сходством по сравнению с базовыми объектами, используя опции Наибольшее сходство или Наименьшее сходство, соответственно. В некоторых случаях вам может понадобиться увидеть оба значения. Например, если значение параметра Сходство равно 3 и для значения параметра Сходство установлено Наиболее и наименее схожие, инструмент вернет три наиболее сходных и три наименее сходных объекта-кандидата.
  • Любое данное решение соответствия в выходных данных будет решением либо наибольшего, либо наименьшего сходства с базовыми объектами; одно решение не может быть тем и другим (и результаты решения не будут дублироваться в выходных объектах). Соответственно, когда для параметра Сходство вы выбираете Наиболее и наименее схожие, максимально возможное число сопоставленных результатов (число результатов) будет равно половине тех, что находятся в присоединяемом слое.
  • Есть два варианта значений для параметра Метод сопоставления:
    • Значения атрибутов – наиболее похожие кандидаты будут иметь наименьшую сумму квадратов различий для всех атрибутов Полей анализа. Все значения стандартизированы до расчета различий.
    • Профили атрибутов – вычисляется косинусный коэффициент подобия. Косинусный коэффициент подобия определяет те же связи среди стандартизованных значений атрибутов, а не пытается сопоставить значения. Например, три поля анализа называются A1, A2 и A3. A2 вдвое больше A1, а A3 почти равно A2. Если значение параметра Метода сопоставления будет Профили атрибутов, инструмент будет искать кандидатов с теми же атрибутивными соотношениями: A2 вдвое больше A1, а А3 почти равно A2. Так как этот метод ищет отношения между атрибутами, вы должны указать минимум два Поля анализа. Вы можете использовать метод косинусного подобия (опция Профили атрибутов) для поиска места, схожего с Лос-Анджелесом, но по другой шкале, например, рассматривая профиль численности населения, сравнив количество машин с количеством жителей моложе 20-ти лет. Косинусный коэффициент подобия может иметь значения от 1.0 (полное сходство) до -1.0 (полное различие). Значение косинусного коэффициента подобия записывается в выходные объекты в поле simindex.
  • Параметр Основывать подобие на должен быть числовым и присутствовать с тем же именем поля, а также быть того же типа как в базовом объекте (цели), так и в поиске (кандидате) присоединяемого набора данных. Если инструмент не находит соответствующие поля для поиска кандидата (присоединяемого слоя), появляется предупреждение о проверке, указывающее, что имена полей должны быть идентичны.
  • Все атрибуты, использованные для сопоставления, записываются в выходные данные. Воспользуйтесь параметром Присоединяемые поля для указания полей, которые будут добавлены в выходную таблицу. По умолчанию добавляются все поля. Используйте параметр Присоединяемые поля для выбора определенных полей, которые хотите добавить из Присоединяемого слоя.

Параметры

ПараметрОписаниеТип данных

Целевой слой (объекты определения местоположения)

Целевой слой содержит базовые объекты. Базовые объекты могут быть дополнительно сокращены или отфильтрованы с помощью параметров Выражения базовых местоположений или Экстента базовых местоположений (ниже).

Объекты

Присоединенный слой (объекты поиска кандидатов)

Присоединяемый слой содержит объекты поиска или объекты-кандидаты. Инструмент вычислит объекты поиска для нахождения объектов со сходными значениями атрибутов полей анализа, сравниваемых с параметром Целевой слой (базовые объекты).

Объекты

Выражение базовых местоположений

Выражение атрибутов Arcade, которое будет вычислено для поддержки фильтрации целевого слоя (базовых объектов). Это выражение настраивается в конструкторе выражений Arcade, для использования которого необходимо щелкнуть Настроить выражение Arcade.

Все записи оцениваются, при этом записи с оценкой true сохраняются, а записи с оценкой false сбрасываются.

Строка (выражение Arcade)

Экстент базовых местоположений

При желании предоставьте экстент для фильтрации базовых местоположений. Только ссылки на объекты, которые находятся в пределах указанного базового пространственного экстента будут сохранены в качестве эталонных объектов.

В конфигурации инструмента, есть компонент выбора экстента, для рисования в пределах базового местоположения.

Конверт EsriJSON

Сходство основано на

Определяет один или несколько интересующих числовых атрибутов (полей анализа). Значения, представленные в этих полях атрибутов, будут вычислены для значения параметра Целевой слой (базовые объекты местоположений).

Затем объекты в параметре Присоединяемый слой (объекты поиска кандидатов) будут вычислены для определения того, какие объекты поиска больше или меньше сходны с базовыми объектами.

Строковый (Названия полей)

Сходство

Определяет, должны ли результаты, возвращаемые этим инструментом, быть больше или меньше похожи на значение параметра Целевой слой (базовые объекты местоположений), заданное для выбранных полей анализа.

Максимальное количество результатов, которое может быть возвращено 10 000.

Вы можете выбрать Схожие, Наименее схожие или Наиболее и наименее схожие, чтобы вернуть объекты.

Целочисленный и Строковый

Метод сопоставления

Есть два доступных метода сопоставления:

  • Значения атрибутов – наиболее похожие кандидаты будут иметь наименьшую сумму квадратов различий для всех атрибутов Полей анализа. Все значения стандартизированы до расчета различий.
  • Профили атрибутов – вычисляется косинусный коэффициент подобия. Косинусный коэффициент подобия определяет те же связи среди стандартизованных значений атрибутов, а не пытается сопоставить значения. Например, три поля анализа называются A1, A2 и A3. A2 вдвое больше A1, а A3 почти равно A2. Если значение параметра Метода сопоставления будет Профили атрибутов, инструмент будет искать кандидатов с теми же атрибутивными соотношениями: A2 вдвое больше A1, а А3 почти равно A2. Так как этот метод ищет отношения между атрибутами, вы должны указать минимум два атрибута Значения атрибутов. Вы можете использовать метод косинусного подобия (опция Профили атрибутов) для поиска места, схожего с Лос-Анджелесом, но по другой шкале, например, рассматривая профиль численности населения, сравнив количество машин с количеством жителей моложе 20-ти лет. Косинусный коэффициент подобия может иметь значения от 1.0 (полное сходство) до -1.0 (полное различие). Значение косинусного коэффициента подобия записывается в выходные объекты в поле simindex.

String

Поля присоединения

Все атрибуты, использованные для сопоставления, записываются в выходные данные. Параметр Присоединяемые поля позволяет указать только определенные поля, которые будут добавлены в выходную таблицу. По умолчанию добавляются все поля. Используйте параметр Присоединяемые поля для выбора определенных полей, которые хотите добавить из значения параметра Присоединяемый слой (поиск кандидатов).

Строковый (Названия полей)

ID базового поля

(дополнительно)

Поле, которое содержит уникальные идентификаторы в схеме Целевой слой (базовые объекты местоположений).

Если поле не выбрано, инструмент создаст уникальные идентификаторы для объектов.

Строка (Имя поля)

ID поля кандидата

(дополнительно)

Поле, которое содержит уникальные идентификаторы в схеме Присоединяемый слой (поиск кандидатов).

Если поле не выбрано, инструмент создаст уникальные идентификаторы для объектов.

Строка (Имя поля)

Выходной слой

Все объекты в параметре Целевой слой (базовые объекты местоположений) и совпадения в параметре Присоединяемый слой (поиск кандидатов) записываются в выходные объекты вместе с атрибутами из параметров Основывать подобие на и Присоединить поля. Кроме того, в выходные объекты будут добавлены следующие поля:

Имя поляОписаниеПримечания

location_type

Строковое поле, указывающее на то, являются ли объекты целевыми базовыми объектами или присоединенными объектами (кандидатами) поиска

simrank

Когда вы выбираете Наиболее схожие или Наиболее и наименее схожие в параметре Схожесть, все найденные совпадения получают ранг от наиболее до наименее схожих. Наиболее сходное решение получает значение ранга 1.

Это поле включается в Выходные объекты, когда вы выбираете Наименее схожие или Наиболее и наименее схожие для параметра Схожесть.

dissimrank

Когда вы выбираете Наименее схожие или Наиболее и наименее схожие в параметре Схожесть, все найденные совпадения получают ранг от наименее до наиболее схожих. Наименее схожее решение получает значение ранга 1.

Это поле включается в Выходные объекты, когда вы выбираете Наименее схожие или Наиболее и наименее схожие для параметра Схожесть.

simindex

В этом поле определяется количественное значение сходства с целевыми базовыми объектами. Когда вы указываете Значения атрибутов для Метода сопоставления, значение представляет собой сумму квадратов разности значений.

Это поле включается в выходные объекты, когда вы выбираете Атрибутивные значения для параметра Метод сопоставления.

cosimindex

В этом поле определяется количественное значение сходства с целевым объектом. Когда вы указываете Профили атрибутов в Методе сопоставления, значение представляет собой сходство косинусов.

Это поле включается в выходные объекты, когда вы выбираете Профили атрибутов для параметра Метод сопоставления.

labelrank

Это поле используется только для целей отображения. Инструмент использует это поле для задания метода отображения результатов анализа по умолчанию.

reference_id

Уникальное значение ID для целевых базовых объектов. Объектам присоединения (кандидатам) поиска дается значение null.

Если параметр ID базового поля не определен, уникальное значение идентификатора создается для базовых объектов.

search_id

Уникальное значение ID для объектов присоединения (кандидатов) поиска. Целевым базовым объектам дается значение null.

Если параметр ID поля кандидата определен, уникальное значение идентификатора создается для объектов Кандидата/поиска.