Методы классификации

Когда вы применяете стили с использованием цвета или размера для отображения числовых данных, вы можете классифицировать эти данные, то есть разделить их на классы или группы, и задать диапазоны и границы для этих классов. Например, вы можете сгруппировать население в 10 групп по возрасту (диапазоны 0-9, 10-19, 20-29 и т.д.) и визуально идентифицировать эти классы на карте.

В зависимости от объема данных у вас может быть до 10 классов. Чем больше данных, тем больше классов можно добавить. То, как вы задаете диапазоны и границы классов — максимальные и минимальные значения каждого класса, — определяет, какие объекты попадут в каждый из классов и как будет выглядеть слой. Изменяя классы с помощью различных методов классификации, вы изменяете внешний вид карты. Как правило, цель состоит в том, чтобы объекты с одинаковыми значениями принадлежали к одному классу.

Естественные границы

Классификация естественных границ (оптимизация по Дженксу) основана на естественной группировке данных. Разрывы в данных определяются через выбор границ классов, которые наилучшим образом группируют схожие значения и максимизируют разницу между классами, например, по высоте деревьев в парке. Объекты делятся на классы, границы которых устанавливаются там, где встречаются относительно большие различия между значениями данных.

Классификация по методу естественных границ хорошо подходит для картирования значений данных, которые распределены не равномерно, поскольку кластеризованные значения попадают в один класс.

Равные интервалы

Метод равных интервалов разбивает диапазон значений атрибута на поддиапазоны равного размера. При классификации по этому методу задается число интервалов (или поддиапазонов), после чего данные разделяются автоматически. Например, если задать три класса для атрибутивного поля со значениями в диапазоне от 0 до 300, будут созданы три класса с диапазонами значений 0–100, 101–200 и 201–300.

Метод равных интервалов наиболее подходит для известных диапазонов значений, например, процентов или температур. Данный метод акцентирует внимание на величине значения атрибута относительно других значений. Например, метод может показать, что магазин входит в группу магазинов, делающих верхнюю треть всех продаж.

Среднеквадратическое отклонение

Классификация методом стандартного отклонения показывает, насколько значения атрибутов объектов отличаются от среднего значения. Метод позволяет выделить значения выше и ниже среднего и отобразить объекты, находящиеся выше или ниже среднего значения. Используйте этот метод классификации, когда важно знать положение значений относительно среднего, например, при изучении плотности населения в каком-то регионе или сравнении уровня обращения взысканий на заложенное имущество по стране. Для большей детализации можно изменить размер класса с 1 среднеквадратического отклонения до 0,5.

Квантиль

В классификации методом квантилей каждый класс содержит равное количество объектов (например, по 10 объектов в классе или по 20 объектов в классе). Здесь не бывает пустых классов или классов, содержащих слишком малое или слишком большое количество значений. Такая классификация хорошо подходит для линейно (равномерно) распределенных данных. Этот метод хорошо подходит, когда нужно иметь одинаковое количество объектов в каждом классе.

Поскольку при использовании метода Квантиль объекты сгруппированы по одинаковому количеству в каждом классе, полученная карта часто может вводить в заблуждение. Похожие объекты могут попасть в разные классы, а объекты с существенно различающимися значениями могут оказаться в одном классе. Вы можете минимизировать искажение, увеличивая число классов.

Интервал вручную

Чтобы задать пользовательские классы, вы можете вручную добавить разрывы классов и установить диапазоны классов, подходящие для ваших данных. Либо вы можете начать с выбора стандартной схемы и затем внести нужные изменения. Возможно, уже существуют определенные стандарты или рекомендации для отображения данных - например, какие-то агентства могут использовать стандартные классы или интервалы для всех карт, такие как шкала Фудзиты (F-шкала), которая используется для классификации силы торнадо.

Дополнительные ресурсы

В статье Better Breaks Define Your Thematic Map's Purpose показаны различия между методами классификации на тематической карте.