El flujo de trabajo de comparaciones de puntos de referencia compara sitios mediante el uso de los criterios y los valores de punto de referencia que define. En primer lugar, seleccione los sitios que desee incluir en el análisis y, a continuación, elija variables y un conjunto de puntos de referencia para comparación. El flujo de trabajo compara los sitios (que se muestran como símbolos codificados con colores en el mapa) y ajusta el análisis cuando se cambia el método de comparación o el valor de los puntos de referencia. Los resultados de este análisis aparecen en el panel Resultados y se pueden guardar como una nueva capa en el proyecto o exportarse a una hoja de cálculo de Excel.
Ejemplo
Una agencia orientada al consumidor está buscando ubicaciones en Pittsburgh, Pensilvania, para una campaña publicitaria de televisión. Ellos utilizan el flujo de trabajo de comparaciones de puntos de referencia para comparar códigos postales en el área de mercado designada (DMA) de Pittsburgh con la lista de variables Población e ingresos y la mediana como valor de punto de referencia. El mapa implementa codificación con colores con el método de comparación Por encima y por debajo del punto de referencia para representar si un código postal está por encima o por debajo de la mediana.
La agencia puede utilizar este análisis para determinar adónde dirigir su campaña publicitaria en función de la comparación de los sitios con el valor de punto de referencia. Por ejemplo, los códigos postales por encima de la mediana representan los ingresos más altos o las áreas más pobladas, ideales para la publicidad de lujo, mientras que los códigos postales por debajo de la mediana podrían destinarse a publicitar productos más económicos. Si la agencia necesita realizar análisis adicionales, podrían utilizar la desviación estándar para evaluar si hay una diferencia de ingresos que podría sugerir promocionar diferentes tipos de productos o servicios en la misma área.
Resultados
Puede ver los resultados del análisis como una capa de mapa y en el panel Resultados, que incluye Resumen , Histograma , Gráfico de burbujas y Tabla . Para obtener más información sobre el panel Resultados de las comparaciones de puntos de referencia, consulte Referencia del panel de resultados. Cada sitio del mapa está codificado con colores para representar las comparaciones de puntos de referencia.
Cálculos
Las comparaciones de puntos de referencia utilizan la distribución de datos para comparar el rendimiento relativo con un punto de referencia. Este análisis utiliza medida de tendencia central, dispersión de datos y la forma de la distribución de datos. Esta información ayuda a los usuarios a identificar si los datos están concentrados o ampliamente dispersos, o si hay valores extremos.
Medidas de tendencia central
Las medidas de tendencia central sirven para resumir las tendencias de datos. En el flujo de trabajo de comparaciones de puntos de referencia, los valores de promedio y mediana están disponibles en las comparativas.
Valor medio
El promedio (o media) se calcula sumando todos los valores y dividiendo la suma entre el número de valores. Proporciona un punto central de los datos. En las comparaciones de puntos de referencia, la media de los datos puede compararse con el punto de referencia para evaluar si las tendencias de los datos se van a situar por encima o por debajo del punto de referencia por término medio.
Mediana
La mediana es el valor medio cuando los datos se ordenan del más bajo al más alto. Si el dataset está sesgado, la mediana podría proporcionar una indicación mejor de la tendencia central que la media porque le afectan menos los valores extremos o atípicos, que pueden distorsionar la media. En las comparaciones de puntos de referencia, la mediana suele utilizarse para conocer el valor típico, sobre todo cuando hay datos sesgados implicados.
Dispersión de datos
La dispersión de datos puede medirse utilizando el rango intercuartílico (IQR) y la desviación estándar (SD). El IQR resulta más adecuado para el análisis con datos sesgados o no normales, mientras que la desviación estándar es más adecuada para análisis con distribuciones normales de datos. Con el análisis de dispersión de datos se puede identificar cualquier valor inusual o atípico. Los valores atípicos representan puntos de datos o valores que se encuentran en un rango anormal y no siguen el patrón del resto de los datos. En concreto, los valores atípicos suelen definirse como valores que se encuentran más de 1,5 veces el IQR por encima de Q3 o por debajo de Q1, o 3 desviaciones estándar alejadas de la media en una distribución normal.
Los valores máximo y mínimo definen el rango en el que se encuentran todos los datos. En las comparaciones de puntos de referencia, los valores máximo y mínimo ayudan a identificar el rango o la dispersión de los datos (es decir, en qué medida están distribuidos los valores de los datos) en comparación con los datos de referencia, que es el punto de referencia utilizado en la comparación. El mínimo es el valor más bajo de los datos. El máximo es el valor más alto de los datos.
Rango intercuartílico (IQR)
El rango intercuartílico (IQR) mide la dispersión del 50% medio de los datos. Es el rango entre el primer cuartil (Q1) y el tercer cuartil (Q3).
- Q1 (1º cuartil): percentil 25 o punto por debajo del 25 por ciento en el que se encuentran los datos.
- Q2 (2º cuartil/mediana): percentil 50 o mediana de los datos.
- Q3 (3º cuartil): percentil 75 o punto por debajo del 75 por ciento en el que se encuentran los datos.
IQR es útil para identificar la dispersión central de datos y a menudo se visualiza en diagramas de caja. Al centrarse en el rango en el que se encuentra el 50 por ciento medio de los datos, el IQR proporciona información sobre la variabilidad de los datos con respecto a la mediana, excluidos los valores extremos o atípicos.
Desviación estándar
La desviación estándar mide la cantidad de variación o dispersión que hay en un dataset. En una distribución normal, cerca del 68,1 por cientos de los puntos de datos se encuentran dentro de ±1 desviación estándar de la media, cerca del 95,4 por ciento se encuentra dentro de ±2 desviaciones estándar y en torno al 99,7 por ciento se encuentra dentro de ±3 desviaciones estándar. Una desviación estándar baja significa que la mayoría de los puntos de datos están próximos a la media, mientras que una desviación estándar alta indica una mayor dispersión de los datos. La evaluación de la desviación estándar ayuda a evaluar la dispersión de los datos en comparación con el punto de referencia.
Forma de la distribución de datos
La forma de la distribución de datos se puede medir mediante el sesgo o la curtosis. El sesgo mide la asimetría de la distribución de datos. Ayuda a aclarar si los datos propenden más hacia valores más altos o más bajos en comparación con el punto de referencia. La curtosis describe el pico y el peso de las colas de una distribución en una distribución de datos en comparación con una distribución normal. Indica la presencia de valores atípicos en comparación con una distribución normal.
Sesgo
El sesgo puede calcularse mediante el uso del sesgo de Pearson basado en la moda, como sigue:
Esta fórmula mide la asimetría de un dataset con respecto a la media y la mediana. El 3 es una constante empírica que ajusta la relación típica en distribuciones sesgadas, donde la diferencia entre la media y la mediana es aproximadamente tres veces más grande en los datos sesgados. Ayuda a cuantificar cuánto se desvían los datos de la simetría, lo que indica si los datos tiene valores altos y bajos más extremos en comparación con la media.
Tras el cálculo, hay tres tipos de sesgo.
Tipo de sesgo | Imagen | Descripción | Cálculo |
---|---|---|---|
Distribución simétrica | Los datos sin sesgo se dispersan de manera uniforme en torno a la media. |
| |
Sesgo positivo (sesgo a derecha) | Hay más valores por debajo de la media, con una larga cola a la derecha. |
| |
Sesgo negativo (sesgo a izquierda) | Hay más valores por encima de la media, con una larga cola a la izquierda. |
|
Curtosis
En el cálculo de la curtosis se emplea la siguiente fórmula:
En esta fórmula, n representa el número de observaciones, μ es la media de la población y σ es la desviación estándar de la población. Una curtosis positiva indica una distribución más pronunciada de lo normal, mientras que un valor negativo indica una distribución más plana. La distribución normal tiene una curtosis de 0.
Tras el cálculo, hay tres tipos de curtosis.
Tipo de curtosis | Imagen | Descripción | Cálculo |
---|---|---|---|
Mesocúrtica | Similar a una distribución normal, indicando valores atípicos moderados. |
| |
Leptocúrtica | Distribución con picos y colas más gruesas, lo que indica más valores atípicos. |
| |
Platicúrtica | Distribución más plana con colas más ligeras, lo que indica menos valores atípicos. |
|
Limitaciones
Puede seleccionar un máximo de 5.000 ubicaciones cada vez. También puede seleccionar hasta 1.000 entidades del mapa, por ejemplo, entidades agregadas al mapa a través de la búsqueda de puntos de interés o importando un archivo.
Créditos
Este flujo de trabajo consume créditos. Se estima que la exportación de resultados a Excel cuesta 10 créditos por cada 1.000 registros.
Consulte Créditos para obtener información completa sobre el consumo de créditos en Business Analyst Web App.
Recursos
Para obtener más información sobre las comparaciones de puntos de referencia, consulte Ejecutar comparaciones de puntos de referencia.