Histograma

Os histogramas resumem visualmente a distribuição de uma variável numérica contínua medindo a frequência com que certos valores aparecem no conjunto de dados. O eixo x em um histograma é uma linha numérica que foi dividida em intervalos de números ou caixas. Para cada compartimento, uma barra é desenhada onde a largura da barra representa o intervalo do compartimento e a altura da barra representa o número de pontos de dados que caem nesse intervalo. Compreender a distribuição de seus dados é uma etapa importante no processo de exploração de dados.

Exemplo

O histograma abaixo mostra a distribuição da participação eleitoral na eleição de 2016 nos Estados Unidos.

  • Número—Comparecimento eleitoral
  • Sobreposições—Média, distribuição normal
O histograma da participação eleitoral na eleição de 2016 nos Estados Unidos

Dados

As configurações da guia Dados Dados incluem a variável que é usada para criar um histograma, o número de bins e as estatísticas que são exibidas no gráfico.

Variável

Os histogramas requerem uma variável numérica contínua no eixo x.

Alguns métodos analíticos requerem que os dados sejam normalmente distribuídos. Quando os dados são distorcidos (a distribuição é desequilibrada), você pode transformar os dados para torná-los normais. Você pode aplicar transformações ao gráfico usando o parâmetro Com transformação. As transformações podem ser logarítmicas ou de raiz quadrada.

Dica:

Para referência, você pode adicionar uma sobreposição de distribuição normal a um histograma selecionando Distribuição normal em Sobreposições.

Transformação logarítmica

A transformação logarítmica é frequentemente usada quando os dados têm uma distribuição distorcida positivamente e existem alguns valores grandes. Se esses valores grandes estiverem localizados em seu conjunto de dados, você pode usar a transformação de log para tornar as variações mais constantes e normalizar os dados.

Os exemplos abaixo mostram a distribuição do total de votos nas eleições de 2016 nos Estados Unidos. A primeira imagem está inclinada positivamente e não tem nenhuma transformação aplicada. A segunda imagem tem uma transformação logarítmica aplicada, o que dá ao histograma uma distribuição mais normal.

Histogramas do total de votos com e sem uma transformação logarítmica

ImagemTransformação
Imagem 1

Nenhum

Imagem 2

Logarítmico

Anotação:

As transformações logarítmicas só podem ser aplicadas a números maiores que zero.

Transformação de raiz quadrada

Uma transformação de raiz quadrada é semelhante a uma transformação logarítmica, pois reduz a assimetria correta de um conjunto de dados. Ao contrário das transformações logarítmicas, as transformações de raiz quadrada podem ser aplicadas a zero.

Anotação:

As transformações de raiz quadrada só podem ser aplicadas a números maiores ou iguais a zero.

Armazenamentos

O número padrão de compartimentos é 32. Você pode ajustar isso alterando o valor de Bins na guia Dados. Alterar o número de compartimentos permite que você veja mais ou menos detalhes na estrutura de seus dados.

Você pode alterar a cor dos compartimentos de um histograma usando a amostra de cor ao lado da cor de bin.

Sobreposições

As seguintes estatísticas descritivas são calculadas e exibidas como linhas em histogramas:

  • Distribuição normal—Uma curva em forma de sino usada para comparar os dados com uma distribuição normal.
  • Média—Uma única linha vertical indicando o valor médio do conjunto de dados.
  • Mediano—Uma única linha vertical indicando o valor médio do conjunto de dados.
  • Desvio padrão—Duas linhas verticais indicando os valores de um desvio padrão acima e abaixo da média.

Clique na sobreposição para ativá-la ou desativá-la. Você pode alterar a cor da linha usando a amostra de cor ao lado da estatística.

Você pode ativar os rótulos usando o parâmetro Mostrar rótulos de dados. Os rótulos indicam a contagem de valores para cada compartimento.

Estatística

As seguintes estatísticas são listadas para o campo numérico selecionado:

  • Média
  • Médio
  • Desvio padrão
  • Linhas
  • Contagem
  • Mínimo
  • Máximo
  • Soma
  • Nulos

Eixos

As configurações da guia EixosEixos são usadas para alterar as especificações do eixo x e y.

Você pode formatar a maneira como os eixos x e y exibem os valores numéricos especificando o número de casas decimais e se deseja incluir um separador de milhar.

Os limites do eixo y padrão são baseados no intervalo de valores de dados representados no eixo y. Você pode personalizar esses valores digitando um valor Limites máximo. Defina um limite do eixo y para manter a escala do gráfico consistente para comparação. Clique no botão Redefinir para reverter o limite do eixo para o valor padrão.

Guias

As configurações da guia Guias Guias são usadas para adicionar guias ou faixas de guias ao gráfico.

Linhas guia ou intervalos podem ser adicionados aos gráficos como referência ou forma de destacar valores significativos. As guias são adicionadas ao eixo y clicando no botão Adicionar guia.

Para criar uma linha guia, insira um valor Inicial onde deseja que a linha seja desenhada. Para criar um intervalo guia, insira um valor Inicial e um valor Final. Você também pode alterar a aparência da linha de guia ou intervalo. Para linhas, o estilo, largura e cor podem ser atualizados. Para intervalos, a cor de preenchimento pode ser atualizada.

Opcionalmente, você pode alterar o nome do guia usando o parâmetro Nome do guia e adicionar texto ao eu guia usando o parâmetro Rótulo do guia (por exemplo, Mediano).

Você pode escolher se o guia é renderizado na parte superior do gráfico ou abaixo do gráfico usando os botões Acima e Abaixo no parâmetro Renderizar.

Formato

As configurações da guia FormatarFormato são usados ​​para alterar a aparência do gráfico formatando elementos de texto e símbolo.

As opções de formatação do gráfico incluem o seguinte:

  • Elementos de texto—Tamanho, cor e estilo da fonte usada para o título do gráfico, título do eixo x, título do eixo y, título da legenda, texto de descrição, texto da legenda, rótulos de eixo e rótulos de dados. Você pode alterar o formato de vários elementos de uma vez pressionando Ctrl e clicando para selecionar os elementos.
  • Elementos de símbolo—Cor, largura e estilo (Sólido, Ponto ou Traço) para linhas de grade e eixo e a cor do plano de fundo do gráfico.

Geral

As configurações da guia GeralGeral são usadas para atualizar os títulos do gráfico, eixos e legenda.

Os títulos padrão dos gráficos e eixos são baseados nos nomes de variáveis ​​e tipo de gráfico. Você pode editar ou desativar os títulos na guia Geral . Você também pode fornecer um título no parâmetro Título da legenda. O Alinhamento da legenda pode ser definido como Direita, Esquerda, Superior ou Inferior. Você também pode adicionar uma descrição do gráfico no parâmeto Descrição. Uma descrição é um bloco de texto que aparece na parte inferior da janela do gráfico.

Recursos

Use os seguintes recursos para saber mais sobre gráficos: