Buscar ubicaciones similares

Icono de la herramienta Disponible en análisis de big data.

La herramienta Buscar ubicaciones similares herramienta Buscar ubicaciones similares identifica las entidades candidatas que son más similares o menos similares a una o varias entidades de referencia en función de los atributos de entidades.

Diagrama de flujo de trabajo

Diagrama del flujo de trabajo Buscar ubicaciones similares

Ejemplos

  • De sus instalaciones de producción, determine cuáles son las más similares a su instalación más productiva en función de la relación entre los valores de atributos numéricos.
  • Una analista delictiva desea buscar en una base de datos de todos los delitos para determinar si un delito reciente podría formar parte de una tendencia o un patrón mayores.
  • Determine otros pueblos con un alto riesgo de enfermedad en función de las características de los pueblos más afectados por una enfermedad.

Notas de uso

  • Se pueden utilizar entidades poligonales, de tabla, punto o polilínea.
  • Las entidades de búsqueda (candidatas) son necesarias y se clasificarán por similitud o disimilitud respecto a las ubicaciones de referencia.
  • Se devolverá un máximo de 10.000 entidades de capa de búsqueda.
  • Si existe más de una entidad en el valor del parámetro Capa de destino (entidades de ubicación de referencia), la coincidencia se basa en valores promedio de entidad de referencia. Por ejemplo, si hay dos entidades de referencia y uno de los atributos de los campos de análisis es una variable de población, la herramienta buscará el valor del parámetro Capa de unión (entidades de búsqueda de candidatas) con poblaciones similares al promedio de los valores de población. Por ejemplo, si los valores de población son 100 y 102, la herramienta buscará candidatos con poblaciones próximas a 101.
    Nota:

    Si existe más de una entidad en el parámetro Capa de destino (entidades de ubicación de referencia), elija Basar similitud en (campos de análisis) para atributos con valores similares. Si, por ejemplo, si el valor de población de una de las entidades es 100 y la otra es 100.000, la herramienta buscará coincidencias con poblaciones próximas al promedio de ambos valores: 50.050. Este valor promedio está lejos del valor de población de ambas capas.

  • Utilice el parámetro Similitud para buscar las entidades que sean más similares o menos similares a las entidades de referencia mediante las opciones Más similar o Menos similar, respectivamente. En algunos casos, quizá le convenga ver ambas. Por ejemplo, si el valor del parámetro Similitud es 3 y el valor del parámetro Similitud es Más y menos similares, la herramienta buscará las tres entidades candidatas más similares y las tres menos similares.
  • Cualquier coincidencia de soluciones dada en la salida será una solución que sea la más similar o la menos similar a las entidades de referencia; una solución no puede ser ambas (y las coincidencias de soluciones no se duplicarán en las entidades de salida). Por lo tanto, si el valor del parámetro Similitud es Más y menos similares, el número máximo de coincidencias resultantes posibles (número de resultados) será la mitad del número de la capa de unión.
  • Dos opciones para el parámetro Método de coincidencia son:
    • Valores de atributos: los candidatos más similares tendrán la suma más pequeña de las diferencias de todos los atributos de los campos de análisis al cuadrado. Todos los valores se estandarizan antes de calcular las diferencias.
    • Perfiles de atributos: se mide la similitud de coseno. La similitud de coseno busca las mismas relaciones entre los valores de atributo estandarizados, en lugar de intentar hacer coincidir magnitudes. Por ejemplo, hay tres campos de análisis llamados A1, A2 y A3. A2 es dos veces mayor que A1, y A3 es casi igual que A2. Si el parámetro Método de coincidencia es Perfiles de atributos, la herramienta buscará candidatos con esas relaciones de atributos: A2 es el doble de grande que A1 y A3 casi igual a A2. Como este método busca relaciones entre atributos, debe especificar un mínimo de dos atributos de campos de análisis. Puede utilizar el método de similitud de coseno (la opción Perfiles de atributos) para buscar lugares similares a Los Ángeles, pero a una escala diferente; por ejemplo, el perfil de población comparado con el número de coches con el número de residentes menores de 20 años. El índice de similitud de coseno fluctúa entre 1,0 (similitud perfecta) y -1,0 (disimilitud perfecta). El índice de similitud de coseno se escribe en el campo simindex de la entidad de salida.
  • El parámetro Basar la similitud en debe ser numérico y estar presente, con el mismo nombre de campo y tipo de campo, tanto en los datasets de entidades de ubicación de referencia (capa de destino) como en los de búsqueda de candidatos (capa de unión). Si la herramienta no encuentra los campos correspondientes para las entidades de búsqueda de candidatos (capa de unión), aparece una advertencia de validación que indica que deben estar presentes nombres de campo idénticos.
  • Todos los atributos utilizados para coincidencias se escriben en la salida. Utilice el parámetro Campos para incorporar para especificar los campos que se van a agregar a la tabla de salida. Por defecto, se agregan todos los campos. Use el parámetro Campos para incorporar para seleccionar campos concretos de la capa de unión que desea agregar.

Parámetros

ParámetroDescripciónTipo de datos

Capa de destino (entidades de ubicaciones de referencia)

La capa de destino que contiene las entidades de referencia. Las entidades de referencia se pueden reducir o filtrar aún más con los parámetros Expresión de ubicaciones de referencia o Extensión de ubicaciones de referencia (a continuación).

Entidades

Capa de unión (entidades de búsqueda candidatas)

La capa de unión que contiene las entidades candidatas o de búsqueda. La herramienta evaluará las entidades de búsqueda para buscar aquellas con valores de atributo de campo de análisis similares en comparación con el parámetro Capa de destino (entidades de referencia).

Entidades

Expresión de ubicaciones de referencia

Una expresión de atributos de Arcade que se evaluará para filtrar la capa de destino (entidades de referencia) que se va a conservar. La expresión se configurada en el generador de expresiones de Arcade, al que se accede haciendo clic en Configurar una expresión de Arcade.

Cada registro se evalúa y los registros que se evalúan como verdaderos se conservan y los que se evalúan como falsos se descartan.

Cadena de caracteres (expresión de Arcade)

Extensión de ubicaciones de referencia

También se puede proporcionar una extensión a las ubicaciones de referencia del filtro. Solo las entidades de referencia que se encuentran en la extensión espacial de referencia especificada para este parámetro se mantendrán como entidades de referencia.

En la configuración de la herramienta, hay un componente del selector de extensión del que se permite obtener una extensión de ubicación de referencia.

Sobre EsriJSON

Basar la similitud en

Especifica uno o varios atributos numéricos (campos de análisis) de interés. Los valores presentes para estos campos de atributos se calcularán para el valor del parámetro Capa de destino (entidades de ubicación de referencia).

A continuación, se evaluarán las entidades del parámetro Capa de unión (entidades de búsqueda de candidatas) para determinar qué entidades de búsqueda son más o menos similares a las entidades de referencia.

Cadena (nombres de campo)

Similitud

Especifica si los resultados devueltos desde esta herramienta deben ser más o menos similares al valor del parámetro Capa de destino (entidades de ubicación de referencia) proporcionado para los campos de análisis especificados.

El número máximo de resultados que se puede devolver es 10.000.

Puede escoger la opción Similar, Menos similar o Más y menos similares para devolver entidades.

Entero y cadena de caracteres

Método de coincidencia

Existen dos métodos de coincidencia:

  • Valores de atributos: los candidatos más similares tendrán la suma más pequeña de las diferencias de todos los atributos de los campos de análisis al cuadrado. Todos los valores se estandarizan antes de calcular las diferencias.
  • Perfiles de atributos: se mide la similitud de coseno. La similitud de coseno busca las mismas relaciones entre los valores de atributo estandarizados, en lugar de intentar hacer coincidir magnitudes. Por ejemplo, hay tres campos de análisis llamados A1, A2 y A3. A2 es dos veces mayor que A1, y A3 es casi igual que A2. Si el valor del parámetro Método de coincidencia es Perfiles de atributos, la herramienta buscará candidatos con las mismas relaciones de atributos: A2 es el doble de grande que A1 y A3 casi igual a A2. Como este método busca relaciones entre atributos, debe especificar un mínimo de dos valores de atributos de Campos de análisis. Puede utilizar el método de similitud de coseno (la opción Perfiles de atributos) para buscar lugares similares a Los Ángeles, pero a una escala diferente; por ejemplo, el perfil de población comparado con el número de coches con el número de residentes menores de 20 años. El índice de similitud de coseno fluctúa entre 1,0 (similitud perfecta) y -1,0 (disimilitud perfecta). El índice de similitud de coseno se escribe en el campo simindex de la entidad de salida.

Cadena de caracteres

Campos para incorporar

Todos los atributos utilizados para coincidencias se escriben en la salida. El parámetro Campos para incorporar permite especificar solamente los campos que se van a agregar a la tabla de salida. Por defecto, se agregan todos los campos. Use el parámetro Campos para incorporar para seleccionar campos concretos del valor del parámetro Capa de unión (entidades de búsqueda candidatas) que desea agregar.

Cadena (nombres de campo)

Campo de Id. de referencia

(opcional)

El campo que contiene Id. únicos en el esquema de Capa de destino (entidades de ubicación de referencia).

Si no se selecciona un campo, la herramienta generará Id. únicos para las entidades.

Cadena (nombre de campo)

Campo de Id. de candidato

(opcional)

El campo que contiene Id. únicos en el esquema de Capa de unión (entidades de búsqueda candidatas).

Si no se selecciona un campo, la herramienta generará Id. únicos para las entidades.

Cadena (nombre de campo)

Capa de salida

Todas las entidades de la Capa de destino (entidades de ubicación de referencia) y las coincidencias de la Capa de unión (entidades de búsqueda candidatas) se escriben en las entidades de salida junto con los atributos de los parámetros Basar similitud en y Campos para incorporar. Además, en las entidades de salida se incluyen los siguientes campos:

Nombre de campoDescripciónNotas

location_type

Una cadena que indica si las entidades son una entidad de referencia de destino o entidades de búsqueda de unión (candidatas).

simrank

Si selecciona Más similar o Más y menos similar en el parámetro Similitud, todas las coincidencias de solución se clasifican de más similar a menos similar. La coincidencia de solución más similar tendrá un valor de clasificación de 1.

Este campo solo se incluye en las entidades de salida si selecciona Menos similar o Más y menos similares en el parámetro Similitud.

dissimrank

Si selecciona Menos similar o Más y menos similar en el parámetro Similitud, todas las coincidencias de solución se clasifican de menos similar a más similar. La solución que sea menos similar tiene un valor de clasificación de 1.

Este campo solo se incluye en las entidades de salida si selecciona Menos similar o Más y menos similares en el parámetro Similitud.

simindex

Este campo cuantifica cuán similar es cada coincidencia de solución a las entidades de referencia de destino. Si especifica Valores de atributos como valor del parámetro Método de coincidencia, este valor representa la suma de las diferencias de los valores al cuadrado.

Este campo solo se incluye en las entidades de salida si selecciona Valores de atributos para el parámetro Método de coincidencia.

cosimindex

Este campo cuantifica cuán similar es cada coincidencia de solución a las entidades de destino. Si especifica Perfiles de atributos para el parámetro Método de coincidencia, este valor representa la similitud de coseno.

Este campo solo se incluye en las entidades de salida cuando se selecciona Perfiles de atributos para el parámetro Método de coincidencia.

labelrank

Este campo es exclusivo para visualización. La herramienta utiliza este campo para una representación predeterminada de los resultados del análisis.

reference_id

Un valor de Id. único para entidades de referencia de destino. A las entidades de búsqueda de unión (candidatas) se les asigna un valor nulo.

Si no se especifica el parámetro Campo de Id. de referencia, se generará un valor de Id. único para las entidades de referencia.

search_id

Un valor de Id. único para las entidades búsqueda de unión (candidatas). A las entidades de referencia de destino se les asigna un valor nulo.

Si no se especifica el parámetro Campo de Id. de candidato, se generará un valor de Id. único para las entidades de búsqueda o candidatas.