Buscar ubicaciones similares—ArcGIS Velocity

Icono de la herramienta Disponible en análisis de big data.

La herramienta Buscar ubicaciones similares identifica las entidades candidatas que son más similares o menos similares a una o varias entidades de referencia en función de los atributos de entidades.

Diagrama de flujo de trabajo

Diagrama del flujo de trabajo Buscar ubicaciones similares

Ejemplos

A continuación, se muestran ejemplos de uso de la herramienta Buscar ubicaciones similares:

Determine cuáles de sus instalaciones de producción son las más similares a su instalación más productiva en función de la relación entre los valores de atributos numéricos.
Realice un análisis delictivos buscando en una base de datos de todos los delitos para determinar si un delito reciente podría formar parte de una tendencia o un patrón mayores.
Determine otros pueblos con un alto riesgo de enfermedad en función de las características de los pueblos más afectados por una enfermedad.

Notas de uso

Tenga en cuenta lo siguiente al trabajar con la herramienta Buscar ubicaciones similares:

Puede utilizar entidades tabulares, de punto, de polilínea o de polígono.
Las entidades de búsqueda (candidatas) son necesarias y se clasifican por similitud o disimilitud respecto a las ubicaciones de referencia.
Se devuelve un máximo de 10.000 entidades de capa de búsqueda.
Si existe más de una entidad en el valor del parámetro Capa de destino (entidades de ubicación de referencia), la coincidencia se basa en valores promedio de entidad de referencia. Por ejemplo, si hay dos entidades de referencia y uno de los atributos de los campos de análisis es una variable de población, la herramienta busca el valor del parámetro Capa de unión (entidades de búsqueda de candidatas) con poblaciones similares al promedio de los valores de población. Por ejemplo, si los valores de población son 100 y 102, la herramienta busca candidatos con poblaciones próximas a 101.
Nota:
Si existe más de una entidad en el parámetro Capa de destino (entidades de ubicación de referencia), elija Basar similitud en (campos de análisis) para atributos con valores similares. Por ejemplo, si el valor de población de una de las entidades es 100 y la otra es 100.000, la herramienta busca coincidencias con poblaciones próximas al promedio de ambos valores: 50.050. Este valor promedio está lejos del valor de población de ambas capas.
Utilice el parámetro Similitud para buscar las entidades que sean más similares o menos similares a las entidades de referencia mediante las opciones Más similar o Menos similar, respectivamente. En algunos casos, quizá le convenga ver ambas. Por ejemplo, si el valor del parámetro Similitud es 3 y el valor del parámetro Similitud es Más y menos similares, la herramienta busca las tres entidades candidatas más similares y las tres menos similares.
Cualquier coincidencia de soluciones dada en la salida es o la más similar o la menos similar a las entidades de referencia; una solución no puede ser ambas (y las coincidencias de soluciones no se duplicarán en las entidades de salida). Por lo tanto, si el valor del parámetro Similitud es Más y menos similares, el número máximo de coincidencias resultantes posibles (número de resultados) es la mitad del número de la capa de unión.
Las dos opciones para el parámetro Método de coincidencia son:
- Valores de atributos: los candidatos más similares tienen la suma más pequeña de las diferencias de todos los atributos de los campos de análisis al cuadrado. Todos los valores se estandarizan antes de calcular las diferencias.
- Perfiles de atributos: se mide la similitud de coseno. La similitud de coseno busca las mismas relaciones entre los valores de atributo estandarizados, en lugar de intentar hacer coincidir magnitudes. Por ejemplo, hay tres campos de análisis llamados A1, A2 y A3. A2 es dos veces mayor que A1, y A3 es casi igual que A2. Si el parámetro Método de coincidencia está configurado en Perfiles de atributos, la herramienta busca candidatos con esas relaciones de atributos: A2 es el doble de grande que A1 y A3 casi igual a A2. Como este método busca relaciones entre atributos, debe especificar un mínimo de dos atributos de campos de análisis. Puede utilizar el método de similitud de coseno (la opción Perfiles de atributos) para buscar lugares similares a Los Ángeles, pero a una escala diferente; por ejemplo, el perfil de población comparado con el número de coches con el número de residentes menores de 20 años. El índice de similitud de coseno fluctúa entre 1,0 (similitud perfecta) y -1,0 (disimilitud perfecta). El índice de similitud de coseno se escribe en el campo simindex de la entidad de salida.
El parámetro Basar la similitud en debe ser numérico y estar presente, con el mismo nombre de campo y tipo de campo, tanto en los datasets de entidades de ubicación de referencia (capa de destino) como en los de búsqueda de candidatos (capa de unión). Si la herramienta no encuentra los campos correspondientes para las entidades de búsqueda de candidatos (capa de unión), aparece una advertencia de validación que indica que deben estar presentes nombres de campo idénticos.
Todos los atributos utilizados para coincidencias se escriben en la salida. Utilice el parámetro Campos para incorporar para especificar los campos que se van a agregar a la salida. Por defecto, se agregan todos los campos. Use el parámetro Campos para incorporar para elegir campos concretos de la capa de unión que desea agregar.

Parámetros

A continuación, se indican los parámetros de la herramienta Buscar ubicaciones similares:


Parámetro	Descripción	Tipo de datos
Capa de destino (entidades de ubicaciones de referencia)	La capa de destino que contiene las entidades de referencia. Las entidades de referencia se pueden reducir o filtrar aún más con los parámetros Expresión de ubicaciones de referencia o Extensión de ubicaciones de referencia (a continuación).	Entidades
Capa de unión (entidades de búsqueda candidatas)	La capa de unión que contiene las entidades candidatas o de búsqueda. La herramienta evalúa las entidades de búsqueda para buscar aquellas con valores de atributo de campo de análisis similares en comparación con el parámetro Capa de destino (entidades de referencia).	Entidades
Expresión de ubicaciones de referencia	Una expresión de atributos de Arcade que se evalúa para filtrar la capa de destino (entidades de referencia) que se va a conservar. La expresión se configurada en el generador de expresiones de Arcade, al que se accede haciendo clic en Configurar una expresión de Arcade. Cada registro se evalúa y los registros que se evalúan como verdaderos se conservan y los que se evalúan como falsos se descartan.	Cadena de caracteres (expresión de Arcade)
Extensión de ubicaciones de referencia (Opcional)	Cuando se utiliza, solo las entidades de referencia que se encuentran en la extensión espacial de referencia especificada para este parámetro se mantienen como entidades de referencia. En la configuración de la herramienta, hay un componente del selector de extensión del que se permite obtener una extensión de ubicación de referencia.	Sobre de Esri JSON
Basar la similitud en (campos de análisis)	Especifica uno o varios atributos numéricos (campos de análisis) de interés. Los valores presentes para estos campos de atributos se calculan para el valor del parámetro Capa de destino (entidades de ubicación de referencia). A continuación, se evalúan las entidades del parámetro Capa de unión (entidades de búsqueda de candidatas) para determinar qué entidades de búsqueda son más o menos similares a las entidades de referencia.	Cadena (nombres de campo)
Similitud	Especifica si los resultados devueltos desde esta herramienta son más o menos similares al valor del parámetro Capa de destino (entidades de ubicación de referencia) proporcionado para los campos de análisis especificados. El número máximo de resultados que se puede devolver es 10.000. Puede escoger la opción de ubicaciones más similares, menos similares o más y menos similares para devolver entidades.	Entero y cadena de caracteres
Método de coincidencia	Existen dos métodos de coincidencia: Valores de atributos: los candidatos más similares tienen la suma más pequeña de las diferencias al cuadrado de todos los atributos de los Campos de análisis. Todos los valores se estandarizan antes de calcular las diferencias. Perfiles de atributos: se mide la similitud de coseno. La similitud de coseno busca las mismas relaciones entre los valores de atributo estandarizados, en lugar de intentar hacer coincidir magnitudes. Por ejemplo, hay tres campos de análisis llamados A1, A2 y A3. Si el valor del parámetro Método de coincidencia es Perfiles de atributos, la herramienta busca candidatos con las mismas relaciones de atributos: A2 es el doble de grande que A1 y A3 casi igual a A2. Como este método busca relaciones entre atributos, debe especificar un mínimo de dos valores de atributos de Campos de análisis. Puede utilizar el método de similitud de coseno (la opción Perfiles de atributos) para buscar lugares similares a Los Ángeles, pero a una escala diferente; por ejemplo, el perfil de población en comparación con el número de coches en comparación con el número de residentes menores de 20 años. El índice de similitud de coseno fluctúa entre 1,0 (similitud perfecta) y -1,0 (disimilitud perfecta). El índice de similitud de coseno se escribe en el campo simindex de la entidad de salida.	Cadena de caracteres
Campos para incorporar	Especifica los campos que se agregarán a la salida. Por defecto, se agregan todos los campos. Use el parámetro Campos para incorporar para elegir campos concretos del valor del parámetro Capa de unión (entidades de búsqueda candidatas) que desea agregar.	Cadena (nombres de campo)
Campo id. de referencia (Opcional)	El campo que contiene Id. únicos en el esquema de Capa de destino (entidades de ubicación de referencia). Si no se selecciona un campo, la herramienta genera Id. únicos para las entidades.	Cadena (nombre de campo)
Campo id. de candidato (Opcional)	El campo que contiene Id. únicos en el esquema de Capa de unión (entidades de búsqueda candidatas). Si no se selecciona un campo, la herramienta genera Id. únicos para las entidades.	Cadena (nombre de campo)

Capa de salida

Todas las entidades de la capa de destino y las coincidencias de la capa de unión se escriben en las entidades de salida junto con los atributos de los parámetros Basar similitud en y Campos para incorporar. Además, en las entidades de salida se incluyen los siguientes campos:


Nombre de campo	Descripción
location_type	Una cadena que indica si las entidades son una entidad de referencia de destino o entidades de búsqueda de unión (candidatas).
simrank	Si elige Más similar o Más y menos similar en el parámetro Similitud, todas las coincidencias de solución se clasifican de más similar a menos similar. La coincidencia de solución más similar tendrá un valor de clasificación de 1. Nota: Este campo solo se incluye en las entidades de salida si selecciona Menos similar o Más y menos similares en el parámetro Similitud.
dissimrank	Si elige Menos similar o Más y menos similar en el parámetro Similitud, todas las coincidencias de solución se clasifican de menos similar a más similar. La solución que sea menos similar tiene un valor de clasificación de 1. Nota: Este campo solo se incluye en las entidades de salida si selecciona Menos similar o Más y menos similares en el parámetro Similitud.
simindex	Este campo cuantifica cuán similar es cada coincidencia de solución a las entidades de referencia de destino. Si especifica Valores de atributos como valor del parámetro Método de coincidencia, este valor representa la suma de las diferencias de los valores al cuadrado. Nota: Este campo solo se incluye en las entidades de salida si selecciona Valores de atributos para el parámetro Método de coincidencia.
cosimindex	Este campo cuantifica cuán similar es cada coincidencia de solución a las entidades de destino. Si especifica Perfiles de atributos para el parámetro Método de coincidencia, este valor representa la similitud de coseno. Nota: Este campo solo se incluye en las entidades de salida cuando se selecciona Perfiles de atributos para el parámetro Método de coincidencia.
labelrank	Este campo es exclusivo para visualización. La herramienta utiliza este campo para una representación predeterminada de los resultados del análisis.
reference_id	Un valor de Id. único para entidades de referencia de destino. A las entidades de búsqueda de unión (candidatas) se les asigna un valor nulo. Si no se especifica el parámetro Campo de Id. de referencia, se genera un valor de Id. único para las entidades de referencia.
search_id	Un valor de Id. único para las entidades búsqueda de unión (candidatas). A las entidades de referencia de destino se les asigna un valor nulo. Si no se especifica el parámetro Campo de Id. de candidato, se genera un valor de Id. único para las entidades de búsqueda o candidatas.

¿Algún comentario sobre este tema?

Diagrama de flujo de trabajo

Ejemplos

Notas de uso

Nota:

Parámetros

Capa de salida

Nota:

Nota:

Nota:

Nota:

En este tema