Классификация данных - это процесс, при котором градуированные числовые значения группируются в диапазоны, и каждый диапазон классификации представлен оттенком или цветом на цветовой шкале или размером символа.
Применяемый метод классификации зависит от данных и от информации, которую вы хотите передать в карте.
Естественные границы
Классификация Естественные границы создает классы, основанные на естественной группировке данных. Эта классификация используется по умолчанию.
Используйте метод естественных границ, если необходимо подчеркнуть естественные группы в данных. Метод естественных границ не должен применяться для сравнения карт, созданных с различными данными. Например, используйте естественные границы, чтобы сравнить преступность в районах по всему городу. Общие показатели преступности будут сгруппированы таким образом, что районы с аналогичным уровнем преступности будут обозначены одним цветом.
Равные интервалы
Классификация Равные интервалы разбивает диапазон значений атрибута на поддиапазоны равного размера.
Классификация методом Равные интервалы подчеркивает величину атрибута относительно других значений. Используйте равные интервалы для данных, имеющих известные диапазоны. Например, используйте равные интервалы для сравнения общих продаж в отделениях сетевых магазинов. Если вы применяете четыре интервала, все магазины будут разделены в диапазоны по 25 %.
Квантиль
Классификация Квантиль разделяет атрибуты по бинам с равным количеством объектов.
Классификация методом Квантили может исказить внешний вид карты, поместив одинаковые значения в разные классы. Используйте этот метод для относительно единообразных данных. Также можно использовать классификацию Квантили для визуального ранжирования. Например, используйте интервалы квантилей для сравнения выбросов углерода между странами за данный год. Если ваш набор данных включает данные выбросов для 100 стран, и вы применяете 10 интервалов, вы сможете выявлять различные группы источников выбросов углерода (10 самых сильных источника, 10 самых низких источника и так далее), но не делать сравнение внутри групп.
Среднеквадратическое отклонение
Стандартное отклонение классифицирует объект на основе того, насколько значения атрибутов объекта отличаются от среднего значения.
Классификация методом средне-квадратического отклонения лучше всего работает с наборами данных, которые имеют нормальное распределение, и для анализа, где важно среднее значение или отклонение от среднего. Например, используйте средне-квадратическое отклонение и расходящуюся цветовую шкалу для сравнения средней продолжительности жизни в различных странах. Страны с самой высокой и самой низкой продолжительностью жизни будут отображаться разными темными оттенками. Цвета станут светлее по мере приближения классов к средней глобальной продолжительности жизни.
Подсказка:
Попробуйте связать классификацию средне-квадратического отклонения с расходящейся цветовой шкалой для получения картограмм. В расходящихся цветовых шкалах верхние и нижние экстремумы окрашены темными оттенками, а среднее значение – нейтральным цветом.
Неклассифицированный
Неклассифицированный отображает числовые данные в непрерывной шкале, а не в дискретных классах.
Используйте неклассифицированный метод, если вы хотите видеть постепенные изменения в данных. Например, неклассифицированную цветовую шкалу можно применять для обозначения измерений средней температуры в заданном диапазоне времени для различных погодных станций. Точки будут показывать постепенные изменения температуры на изучаемой области.
Вручную
Классификация Вручную позволяет добавить пользовательские границы классов, подходящие для ваших данных.
Классификация Вручную может использоваться для создания новых границ классов или для изменения границ, созданных с использованием другого метода классификации. Например, вы можете классифицировать данные, используя равные интервалы, а затем использовать ручную классификацию, чтобы изменить границы на округленные числа.
Метод Вручную следует использовать, когда известны диапазоны, которые необходимо применить к данным, например, когда требуется создать несколько карт с одинаковыми интервалами значений. Например, используйте ручную классификацию, чтобы сравнить количество пустующих домов в районах города за определенный период времени. Вы можете применить одни и те же интервалы к обеим картам, чтобы увидеть закономерности и сравнить данные без ложных предположений из-за различий в классификации.
Ресурсы
Для дополнительной информации см. следующие ссылки: