La clasificación de datos es un proceso en el que los valores numéricos graduados se agrupan en rangos y cada rango de clasificación está representado con un tono o color en la rampa de color. La clasificación está disponible para relojes de datos y gráficos de calor.
El método de clasificación que utilice depende de los datos que esté usando y la información que desee trasmitir en el gráfico.
Cortes naturales
La clasificación de cortes naturales crea clases que se basan en agrupaciones naturales inherentes a los datos. Este es el método de clasificación predeterminado.
Utilice la clasificación de cortes naturales cuando desee resaltar las agrupaciones naturales de los datos. Por ejemplo, utilice cortes naturales para comparar los índices de delincuencia de una ciudad a lo largo de meses y años mediante un reloj de datos. Las tasas de delincuencia se agruparán de manera que los meses y años con una tasa de delincuencia similar se simbolizarán con el mismo color.
No utilice cortes naturales para comparar gráficos creados con datos diferentes.
Intervalo equivalente
La clasificación de intervalo equivalente divide el rango de valores de atributo en subrangos de igual tamaño.
La clasificación de intervalos equivalentes resalta la cantidad de un atributo relativo a otros valores. Utilice intervalo equivalente para datos que presentan rangos familiares. Por ejemplo, utilice intervalos equivalentes para comparar el porcentaje de diferentes especies de árboles con escarabajos invasores en los parques de un condado mediante un gráfico de calor. Los porcentajes van del 0 al 100. Si utiliza cuatro bins, las clases se basarán en intervalos del 25 por ciento.
Cuantil
La clasificación de cuantiles divide los atributos en bins con el mismo número de entidades.
La clasificación de cuantiles puede distorsionar el aspecto de un gráfico colocando valores similares en clases diferentes. Utilice la clasificación de cuantiles para datos relativamente uniformes. También puede usar la clasificación de cuantiles para clasificación visual. Por ejemplo, use los intervalos de cuantiles para comparar las tasas de desempleo de los diferentes estados de los Estados Unidos por año mediante un gráfico de calor. Si aplica cinco bins a los 50 estados y al Distrito de Columbia, habrá aproximadamente 10 estados por bin. Los resultados se pueden usar para ver las tasas de desempleo clasificadas en grupos de 10.
Manual
La clasificación manual agrega rupturas de clase personalizados que son apropiados para los datos.
La clasificación manual puede utilizarse para crear nuevas rupturas de clase o modificar las rupturas creadas mediante un método de clasificación diferente. Por ejemplo, puede clasificar los datos mediante intervalos iguales y utilizar la clasificación manual para modificar los intervalos a números enteros.
Use la clasificación manual cuando haya rangos conocidos que deban aplicarse a los datos, como cuando se crean varios gráficos con los mismos bins. Por ejemplo, use la clasificación manual para comparar el coste medio del alquiler de vivienda por mes y año para distintos barrios mediante un reloj de datos. Se pueden aplicar los mismos bins a todos los gráficos, de forma que se pueden crear patrones y realizar comparaciones sin hacer suposiciones erróneas que se deban a las diferencias de la clasificación.
Recursos
Utilice los recursos siguientes para más información: