Классификация данных - это процесс, при котором градуированные числовые значения группируются в диапазоны, и каждый диапазон классификации представлен оттенком или цветом на цветовой шкале. Классификация доступна для диаграммы хронометража данных и интенсивности.
Применяемый метод классификации зависит от данных и от информации, которую вы хотите передать на диаграмме.
Естественные границы
Классификация Естественные границы создает классы, основанные на естественной группировке данных. Эта классификация используется по умолчанию.
Используйте метод естественных границ, если необходимо подчеркнуть естественные группы в данных. Например, используйте естественные границы, чтобы сравнить уровень преступности в городе за месяцы и годы, используя данные по часам. Показатели преступности будут сгруппированы таким образом, что месяцы и годы с аналогичным уровнем преступности будут обозначены одним цветом.
Метод естественных границ не должен применяться для сравнения диаграмм, созданных с различными данными.
Равные интервалы
Классификация Равные интервалы разбивает диапазон значений атрибута на поддиапазоны равного размера.
Классификация методом Равные интервалы подчеркивает величину атрибута относительно других значений. Используйте равные интервалы для данных, имеющих известные диапазоны. Например, используйте равные интервалы для сравнения процента различных видов деревьев с инвазивными жуками в парках по округу, используя диаграмму интенсивности. Диапазон процентов от 0 до 100. Если вы будете использовать четыре интервала, классы будут основаны на интервалах 25%.
Квантиль
Классификация Квантиль разделяет атрибуты по бинам с равным количеством объектов.
Классификация методом Квантили может исказить внешний вид диаграммы, поместив одинаковые значения в разные классы. Используйте этот метод для относительно единообразных данных. Также можно использовать классификацию Квантили для визуального ранжирования. Например, используйте интервалы квантилей для сравнения уровней безработицы по штатам в США на диаграмме интенсивности. Если применить пять интервалов к 50 штатам и округу Колумбия, в интервале будет примерно 10 штатов. Результаты могут быть использованы для оценки уровня безработицы в группах по 10 человек.
Вручную
Классификация Вручную позволяет добавить пользовательские границы классов, подходящие для данных.
Классификация Вручную может использоваться для создания новых границ классов или для изменения границ, созданных с использованием другого метода классификации. Например, вы можете классифицировать данные, используя равные интервалы, а затем использовать ручную классификацию, чтобы изменить границы на округленные числа.
Метод Вручную следует использовать, когда известны диапазоны, которые необходимо применить к данным, например, когда требуется создать несколько диаграмм с одинаковыми интервалами значений. Например, используйте ручную классификацию, чтобы сравнить среднюю стоимость аренды жилья по месяцам и годам для разных районов, используя хронометраж данных. Вы можете применить одни и те же интервалы ко всем диаграммам, чтобы увидеть закономерности и сравнить данные без ложных предположений из-за различий в классификации.
Ресурсы
Для дополнительной информации см. следующие ссылки: