Referência de correlação da variável

Na análise de adequação, você pode usar a ferramenta de matriz de correlação para avaliar como suas variáveis ​​se correlacionam entre si e a pontuação final. Essa análise identifica a multicolinearidade (variáveis ​​sobrepostas ou redundantes), o que proporciona melhor seleção de variáveis, decisões mais ponderadas e um design de índice de adequação mais forte.

As análises de adequação geralmente incluem variáveis ​​que medem conceitos semelhantes. Se você não verificar a sobreposição, poderá contar um conceito duas vezes e distorcer os resultados.

Exemplo

Uma agência governamental está usando análise de adequação para identificar possíveis locais para um banco de alimentos temporário. Na análise, eles incluíram a taxa de pobreza e a taxa de desemprego como variáveis. Usando a matriz de correlação, fica claro que há uma alta correlação entre a taxa de pobreza e a taxa de desemprego. Sem ajustes, a análise pode superestimar a desvantagem econômica. É recomendável que os analistas considerem remover uma variável do par redundante, mesclar variáveis ​​relacionadas em um subíndice ou ajustar seus pesos para que o conceito não seja contado duas vezes.

Exemplo de matriz de correlação

Resultados

A matriz de correlação analisa os resultados de uma análise de adequação para validar suas escolhas de variáveis. Por exemplo, você pode identificar a multicolinearidade e a influência do índice de equilíbrio. Usando esse conhecimento, você pode melhorar a força da sua análise de adequação.

Para validar suas escolhas de variáveis ​​usando a matriz de correlação, faça o seguinte:

  • Multicolinearidade pontual. A multicolinearidade ocorre quando duas ou mais variáveis ​​são tão altamente correlacionadas que capturam as mesmas informações, dificultando a distinção do efeito individual de cada variável. Verifique pares de variáveis ​​com alta correlação (por exemplo, r de Pearson > 0,75). Para reduzir a multicolinearidade, você pode considerar as seguintes soluções:
    • Removendo uma variável de um par altamente correlacionado
    • Mesclar variáveis ​​correlacionadas em um subíndice (por exemplo, vulnerabilidade econômica ou acesso à saúde)
    • Ajustar pesos para mitigar o efeito de variáveis ​​altamente correlacionadas, para que o mesmo conceito subjacente não seja contado duas vezes
    Anotação:

    Sempre aplique conhecimento de domínio ao modificar pesos.

  • Influência do índice de equilíbrio. Marque qualquer variável que esteja fortemente correlacionada com a pontuação final (por exemplo, r de Pearson > 0,85). Ajuste seu peso ou agrupe-o com variáveis ​​relacionadas em um subíndice para que nenhum fator único domine o modelo. Consulte Criação de índices compostos usando ArcGIS para obter orientações detalhadas sobre a construção de subíndices.

Cálculos

A análise de adequação realiza cálculos usando variáveis ​​selecionadas; geralmente inclui variáveis ​​que são conceitualmente ou estatisticamente semelhantes. Sem verificar a sobreposição, você pode incluir involuntariamente diversas variáveis ​​representando o mesmo conceito subjacente, levando a resultados tendenciosos ou distorcidos.

Coeficiente de correlação

O r de Pearson é um coeficiente que varia entre -1 e 1 que mede tanto a força quanto a direção de uma relação linear. Por exemplo, valores mais próximos de +1 indicam uma forte relação positiva, enquanto valores mais próximos de -1 indicam uma forte relação negativa. Valores próximos de 0 indicam pouca ou nenhuma relação linear. Na matriz de correlação, você pode filtrar a visualização com base no valor de r de Pearson.

Significância de estatística

A significância estatística informa se uma correlação tem probabilidade de ser real, não apenas devido ao acaso. Valores de p mais baixos (por exemplo, p < 0,01) indicam uma relação estatisticamente mais confiável, o que significa que a correlação é menos provável devido ao acaso. Na maioria dos casos, um valor de p abaixo de 0,05 é considerado estatisticamente significativo. Um valor de p de 0,05 corresponde a um nível de confiança de 95% e é um limite comum para determinar significância estatística.

Na matriz de correlação, você pode filtrar a visualização com base na significância estatística das variáveis. Asteriscos são usados ​​para representar significância estatística da seguinte forma:

Asteriscosvalor-pSignificância de estatística

***

p < 0.001

Altamente significativo

**

p < 0.01

Moderadamente significativo

*

p < 0.05

Significativo

Nenhum

Nenhum

Não estatisticamente significativo

Limitações

A matriz de correlação só está disponível no fluxo de trabalho de análise de adequação.

Créditos

Este fluxo de trabalho consome créditos. Exportar resultados para Excel custa uma estimativa de 10 créditos por 1.000 registros.

Consulte Créditos para obter informações completas sobre o consumo de crédito no Business Analyst Web App.

Requisitos de licenciamento

O fluxo de trabalho da análise de adequação está disponível para usuários com uma licença Advanced do Business Analyst Web App. Para saber mais sobre tipo de licença do Business Analyst, consulte Licenças.

Recursos

Para saber mais sobre a análise de adequação, consulte os seguintes recursos: