Criar e utilizar um histograma

Insights in ArcGIS Online
Insights no ArcGIS Enterprise
Insights desktop

Os histogramas agregam dados numéricos em grupos de intervalos idênticos, denominados bins e exibem a frequência de valores dentro de cada bin. Um histograma é criado utilizando um único campo de número ou taxa/proporção.

Os histogramas podem responder perguntas sobre seus dados, como O que é a distribuição de valores numéricos e sua frequência de ocorrência em um conjunto de dados? Há valores atípicos?

Exemplo

Uma organização de saúde não governamental está estudando as taxas de obesidade entre adolescentes nos Estados Unidos. Um histograma de frequência de obesidade em jovens ao longo de cada estado pode ser utilizado para determinar a distribuição das taxas de obesidade, incluindo as frequências mais e menos comuns e uma faixa global.

Histograma mostrando a distribuição das taxas de obesidade em adolescentes nos Estados Unidos

O histograma acima mostra uma distribuição normal e indica que as taxas mais frequentes estão entre as faixas de 10 e 14 porcento.

Aumentar ou diminuir o número de caixas pode ter um efeito sobre como você analisa seus dados. Enquanto os dados propriamente não são alterados, sua aparência pode ser. É importante escolher um número apropriado de caixas para seus dados de forma que padrões nos dados não sejam mal interpretados. Poucos bins podem ocultar padrões importantes e muitos bins podem fazer pouco, mas flutuações esperadas em dados parecem importantes. A seguinte figura é um exemplo de um número apropriado de bins para os dados. Cada bin contém uma faixa de aproximadamente 1 porcento e os dados podem ser examinados em uma escala melhor para visualizar os padrões que não são visíveis ao utilizar seis bins. Neste caso, o padrão que emerge é uma distribuição normal ao redor da média com uma leve, mas provavelmente não significante, distorção em direção à esquerda.

Histograma com 12 bins que mostram os novos padrões

Criar um histograma

Para criar um histograma, complete as seguintes etapas:

  1. Selecione um número Campo de número ou campo de taxa/relação Campo de taxa/proporção.
    Dica:

    Você pode procurar por campos utilizando a barra de pesquisa no painel de dados.

  2. Crie o histograma utilizando as etapas seguintes:
    1. Arraste os campos selecionados para um novo cartão.
    2. Paire sobre a área Gráfico .
    3. Solte os campos selecionados no Histograma.
Dica:

Você também pode criar gráficos utilizando o menu Gráfico acima do painel de dados ou o botão Tipo de visualização Tipo de visualização em um cartão existente. Para o menu Gráfico , somente gráficos que são compatíveis com sua seleção de dados estarão habilitados. Para o menu Tipo de visualização , somente visualizações compatíveis (incluindo mapas, gráficos ou tabelas) serão exibidas.

Os histogramas também podem ser criados utilizando Visualizar Histograma, que é acessado a partir do botão Ação Ação em Localizar respostas > Como isto é distribuído?

Anotações de uso

Os histogramas são simbolizados por valores únicos. Você pode utilizar o botão Opções da Camada Legenda para alterar a cor de símbolo e cor de contorno, que será aplicada em todas as caixas.

Quando um histograma é criado, o Insights calcula automaticamente um número apropriado de bins para exibir seus dados. Você pode alterar o número de bins utilizando o controle deslizante ao longo do eixo x ou clicando no número de bins e inserindo um novo número.

Anotação:

Se o número de bins escolhido não for dividido igualmente no intervalo de dados, os bins serão calculadas usando valores decimais. Os histogramas exibem números inteiros arredondados como seus rótulos de bin, em vez de decimais. Os números inteiros arredondados são apenas para exibição e os valores decimais são usados ​​para todos os cálculos. Em um caso onde um bin inclui valores de dados próximos ao limite superior ou inferior e o rótulo é arredondado, os valores inicial e final do bin podem parecer incorretos pois os rótulos estão exibindo valores arredondados em vez de decimais.

Utilize o botão Estatísticas de gráfico Estatística do gráfico para exibir a média, mediano e distribuição normal dos dados. Uma curva de distribuição normal representa a distribuição esperada de uma amostra aleatória de dados contínuos, onde a maior frequência de valores é centralizada em torno da média e a frequência de valores diminui à medida que os valores aumentam ou diminuem para fora da média. Uma curva de distribuição normal é útil para determinar se os seus dados têm bias (por exemplo, os dados têm uma maior frequência de valores baixos) ou valores atípicos.

Utilize o botão Tipo de visualização Tipo de visualização para alternar diretamente entre um histograma e um mapa de símbolos graduados ou tabela de resumo.

Utilize o botão Inverter cartão Inverter cartão para visualizar o verso do cartão. A guia Informações do cartão Informação do cartão fornece informações sobre os dados no cartão e a guia Exportar dados Exportar Dados permite que os usuários exportem os dados do cartão.

A parte de trás de um histograma exibe os seguintes valores calculados: Média, mediana, desvio padrão, distorção e curtose (simplificado). A distorção e curtose são descritas na seguinte tabela:

EstatísticaDescrição

Distorção

A distorção determina se a distribuição de dados é simétrica. A medição da distorção determina se a maioria dos valores de distribuição situa-se à esquerda ou à direita da média. A distorção da distribuição normal é zero, mostrando uma quantidade igual de dados em ambos os lados da média.

Os valores de distorção podem ser zero, negativo ou positivo como seguem:

  • Zero—Os dados tem uma distribuição simétrica.
  • Negativo—Os dados são assimétricos com uma distorção à direita. A maior frequência de valores encontrada à direita da média e a cauda à esquerda é mais longa que a cauda à direita. A mediana é maior que a média.
  • Positivo—Os dados são assimétricos com uma distorção à esquerda. A maior frequência de valores encontrada à esquerda do centro e a cauda à direita é mais longa que a cauda à esquerda. A média é maior que a mediana.

Curtose

A curtose descreve a forma da distribuição de frequência e fornece uma medida de probabilidade que a distribuição produzirá valores atípicos. As distribuições com caudas relativamente pesadas são denominadas leptocúrticas e têm uma curtose maior que zero. As distribuições com caudas relativamente leves são denominadas platicúrticas e têm uma curtose menor que zero. A curtose de uma distribuição normal é igual a três ou ao utilizar 'curtose simplificada', a curtose de uma distribuição normal é zero (Isto é encontrado utilizando a mesma fórmula como a curtose e menos 3).

Os valores simplificados da curtose podem ser zero, negativo ou positivo como seguem:

  • Zero—O modo é o mesmo que a média.
  • Negativo—A distribuição de dados tem caudas mais curtas e o pico é mais achatado.
  • Positivo—As caudas da curva são mais longas e o pico é mais alto.