O fluxo de trabalho de comparações de referência compara sites usando critérios e valores de referência definidos por você. Primeiro, selecione os sites a serem incluídos na análise e, em seguida, escolha as variáveis e defina uma referência para comparação. O fluxo de trabalho compara seus locais, exibidos como símbolos codificados por cores no mapa, e ajusta a análise conforme você altera o método de comparação ou o valor de referência. Os resultados dessa análise aparecem no painel Resultados e podem ser salvos como uma nova camada em seu projeto ou exportados para uma planilha do Excel.
Exemplo
Uma agência B2B está pesquisando locais em Pittsburgh, Pensilvânia, para uma campanha publicitária de televisão. Eles usam o fluxo de trabalho de comparações de referência para comparar códigos postais na área de mercado designada (DMA) de Pittsburgh com a lista de variáveis de População e renda e a mediana como valor de referência. O mapa implementa codificação de cores com o método de comparação de Referência acima e abaixo para representar se um código postal está acima ou abaixo da mediana.
A agência pode usar essa análise para determinar onde direcionar sua campanha publicitária com base em como os sites se comparam ao valor de referência. Por exemplo, códigos postais acima da mediana representam áreas de renda mais alta ou mais populosas, ideais para publicidade de luxo, enquanto códigos postais abaixo da mediana podem ter como alvo produtos de baixo custo. Se a agência precisasse realizar análises adicionais, ela poderia usar o desvio padrão para avaliar se há uma diferença de renda que poderia sugerir segmentar diferentes tipos de produtos ou serviços na mesma área.
Resultados
Você pode visualizar os resultados da análise como uma camada de mapa e no painel Resultados, que inclui um Resumo , Histograma , Gráfico de bolhas , e Tabela . Para saber mais sobre o painel Resultados das comparações de referência, consulte Referência do painel Resultados. Cada local no mapa é codificado por cores para representar as comparações de referência.
Cálculos
As comparações de referência usam a distribuição de dados para comparar o desempenho em relação a uma referência. Esta análise usa medidas de tendência central, dispersão de dados e formato da distribuição de dados. Essas informações ajudam os usuários a identificar se os dados estão concentrados ou amplamente espalhados, ou se há valores extremos.
Medidas de tendência central
Medidas de tendência central são usadas para resumir tendências de dados. No fluxo de trabalho de comparações de referência, os valores médios e medianos estão disponíveis para referências.
Média
A média é calculada somando todos os valores e dividindo essa soma pelo número de valores. Ela fornece um ponto central dos dados. Em comparações de referência, a média dos dados pode ser comparada à referência para avaliar se os dados tendem a ser maiores ou menores que a referência em média.
Mediana
A mediana é o valor médio quando os dados são ordenados do menor para o maior. Se o conjunto de dados for distorcido, a mediana pode fornecer uma indicação melhor da tendência central do que a média, porque é menos afetada por valores extremos ou atípicos, que podem distorcer a média. Em comparações de referência, a mediana é frequentemente usada para entender o valor típico, especialmente quando há dados distorcidos envolvidos.
Propagação de dados
A dispersão dos dados pode ser medida usando o intervalo interquartil (IQR) ou o desvio padrão (DP). O IQR é mais adequado para análises com dados distorcidos ou não normais, enquanto o desvio padrão é mais apropriado para análises com distribuições normais de dados. Analisar a dispersão de dados pode identificar quaisquer valores incomuns ou discrepantes. Os valores atípicos representam pontos de dados ou valores que estão em um intervalo anormal e não seguem o padrão de restante dos dados. Especificamente, valores discrepantes são normalmente definidos como valores que caem mais de 1,5 vezes o IQR acima de Q3 ou abaixo de Q1, ou 3 desvios padrão da média em uma distribuição normal.
Os valores mínimo e máximo definem o intervalo dentro do qual todos os dados se enquadram. Em comparações de referência, os valores mínimo e máximo ajudam a identificar o intervalo ou a dispersão dos dados (ou seja, quão amplamente os valores dos dados são distribuídos) em comparação com os dados de referência, que são as referências usadas para comparação. O mínimo é o menor valor nos dados. O máximo é o maior valor nos dados.
Faixa inter-quartil (IQR)
A faixa inter-quartil (IQR) mede a dispersão dos 50% intermediários dos dados. É a faixa entre o 1º quartil (Q1) e o 3º quartil (Q3).
- Q1 (1º quartil): O 25º percentil, ou o ponto abaixo do qual 25% dos dados estão.
- Q2 (2º quartil/Mediana): O 50º percentil, ou a mediana dos dados.
- Q3 (3º quartil): O 75º percentil, ou o ponto abaixo do qual 75% dos dados estão.
O IQR é útil para identificar a distribuição central dos dados e geralmente é visualizado em gráficos de caixa. Ao focar no intervalo dentro do qual os 50% intermediários dos dados se enquadram, o IQR fornece informações sobre a variabilidade dos dados em torno da mediana, excluindo valores extremos ou discrepantes.
Desvio padrão
O desvio padrão mede quanta variação ou dispersão há em um conjunto de dados. Em uma distribuição normal, aproximadamente 68,1% dos pontos de dados estão dentro de ±1 desvio padrão da média, cerca de 95,4% estão dentro de ±2 desvios padrão e cerca de 99,7% estão dentro de ±3 desvios padrão. Um desvio padrão baixo significa que a maioria dos pontos de dados está próxima da média, enquanto um desvio padrão alto indica uma ampla dispersão de dados. Avaliar o desvio padrão ajuda a avaliar o quão dispersos os dados estão em comparação às referências.
Forma de distribuição de dados
A forma da distribuição de dados pode ser medida usando assimetria e curtose. A assimetria mede a assimetria de uma distribuição de dados. Ajuda a esclarecer se os dados tendem mais para valores mais altos ou mais baixos em comparação às referências. Curtose descreve o pico e o peso das caudas em uma distribuição de dados em comparação a uma distribuição normal. Indica a presença de valores atípicos em comparação a uma distribuição normal.
Distorção
A assimetria pode ser calculada usando a assimetria do modo Pearson, da seguinte forma:
Esta fórmula mede o quão assimétrico um conjunto de dados é comparando a média e a mediana. O 3 é uma constante empírica que se ajusta ao relacionamento típico em distribuições assimétricas, onde a diferença entre a média e a mediana é aproximadamente três vezes maior em dados assimétricos. Ela ajuda a quantificar o quanto os dados se desviam da simetria, indicando se os dados têm valores mais extremos, altos e baixos, em comparação à média.
Após o cálculo, há três tipos de inclinação.
Tipo de inclinação | Imagem | Descrição | Cálculo |
---|---|---|---|
Distribuição simétrica | Sem inclinação, os dados são distribuídos uniformemente em torno da média. |
| |
Inclinação positiva (inclinação à direita) | Mais valores ficam abaixo da média, com uma cauda longa à direita. |
| |
Inclinação negativa (inclinação à esquerda) | Mais valores ficam acima da média, com uma cauda longa à esquerda. |
|
Curtose
A curtose é calculada usando a seguinte fórmula:
Nesta fórmula, n representa o número de observações, μ é a média populacional e σ é o desvio padrão da população. Uma curtose positiva indica uma distribuição mais pontiaguda do que o normal, enquanto um valor negativo indica uma distribuição mais plana. Uma distribuição normal tem uma curtose de 0.
Após o cálculo, existem três tipos de curtose.
Tipo de curtose | Imagem | Descrição | Cálculo |
---|---|---|---|
Mesocúrtico | Semelhante a uma distribuição normal, indicando valores discrepantes moderados. |
| |
Leptocúrtico | Distribuição com picos e caudas mais pesadas, indicando mais valores atípicos. |
| |
Platicúrtico | Distribuição mais plana com caudas mais claras, indicando menos valores atípicos. |
|
Limitações
Você pode selecionar um máximo de 5,000 locais existentes. Como alternativa, você pode selecionar até 1.000 feições no mapa—por exemplo—feições adicionadas ao mapa por meio de uma pesquisa de pontos de interesse ou importando um arquivo.
Créditos
Este fluxo de trabalho consome créditos. Exportar resultados para Excel custa uma estimativa de 10 créditos por 1.000 registros.
Consulte Créditos para obter informações completas sobre o consumo de crédito no Business Analyst Web App.
Recursos
Para saber mais sobre comparações de referência, consulte Executar comparações de referência.