Создание и использование точечной диаграммы

Insights в ArcGIS Online
Insights в ArcGIS Enterprise
Insights desktop

Точечная диаграмма применяется для определения степени, с которой две числовые переменные влияют друг на друга. По оси х откладывается независимая переменная, а по оси y – зависимая переменная.

Точечная диаграмма может ответить на вопросы о ваших данных, такие как: Каково отношение между переменными? Как распределены данные? Где находятся выбросы?

Примеры

На примерах ниже показаны диаграммы рассеяния, использующие две, три переменные или бины.

Две переменные

Департаментом общественных работ было замечено увеличение утечек в водопроводных сетях. Департаменту требуется узнать, каково влияние общей длины труб на количество протечек, по сравнению с влиянием таких свойств труб, как их возраст и длина контура. Для отображения отношения общего числа протечек к длине труб в каждой зоне можно использовать точечную диаграмму.

Точечная диаграмма общей длины труб и общего числа протечек

Управление общественных сооружений хочет получить информацию о том, существует ли какая-то разница в состоянии труб, обследованных в разное время года. С использованием опции Окрасить по можно отобразить точки уникальными для каждого значения заданного поля цветами.

Точечная диаграмма с категориями по месяцам даты исследования

Приведенная выше диаграмма рассеяния показывает, что большинство исследований труб было выполнено в апреле.

Для точечной диаграммы может быть применен регрессионный анализ для определения силы и направления отношений между зависимой и независимой переменными. Статистические модели могут быть отображены прямой или дуговой линией, в зависимости от вашего выбора для диаграммы статистики. Для измерения влияния длины труб на число протечек можно добавить значение R2.

Точечная диаграмма с категориями – месяцами и линией наилучшего соответствия

Добавление третьей переменной

Департаментом общественных работ было замечено увеличение утечек в водопроводных сетях. Департаменту требуется узнать, каково влияние общей длины труб на количество протечек, по сравнению с влиянием таких свойств труб, как их диаметр и возраст. Департамент также хочет определить, есть ли связь между количеством утечек или длиной труб и суточных расходов на них (включая стоимость установки, обслуживания и ремонта и связанные с потерями ресурсов в результате утечек издержки). Точечная диаграмма с пропорциональными символами может использоваться для показа зависимости общего количества утечек от длины труб в каждой зоне, причем, размер точек будет соответствовать ежедневным расходам на водопровод.

Точечная диаграмма с декартовой системой координат, отображающая влияние длины труб на число утечек

Подсказка:

Drag-N Drop Перетащите числовое поле на вашу страницу и поместите его на точечную диаграмму, чтобы диаграмма приобрела градуированные символы.

Управление общественных сооружений хочет получить информацию о том, существует ли какая-то разница в состоянии труб, обследованных в разное время года. С использованием опции Окрасить по можно отобразить точки уникальными для каждого значения заданного поля цветами.

Точечная диаграмма, использующая декартовую систему координат для значений длины труб и числа утечек и пропорциональные символы – для показа стоимости

Приведенная выше диаграмма рассеяния показывает, что большинство исследований труб было выполнено в апреле.

Визуализация с помощью бинов

ГИС-аналитик работает на сообщество специалистов и хочет выяснить, в каких штатах находятся самые высокорейтинговые учебные заведения. Он начинает свой анализ с создания диаграммы рассеяния, показывающей стоимость обучения в колледже и средний заработок после окончания учебы. Эта диаграмма показывает положительные отношения, но точки распределены слишком плотно, чтобы выявить какие-то другие закономерности.

Диаграмма рассеяния, показывающая стоимость обучения и зарплату после окончания колледжа в США

Аналитик может поменять стиль диаграммы на Бины, чтобы посмотреть распределение точек на ней. Диаграмма показывает, что самая высокая концентрация колледжей обходится примерно в 20 000 долларов и приводит к доходам до 50 000 долларов.

Диаграмма, показывающая стоимость и зарплату после окончания учебы, оформленная с помощью бинов

Создание точечной диаграммы

Для создания точечной диаграммы выполните следующие шаги:

  1. Выберите два числовых поля Числовое поле или два поля доля/отношение Поле доля/отношение.
    Подсказка:

    Вы можете выполнять поиск по полям с помощью строки поиска в панели данных.

  2. Создайте точечную диаграмму, выполнив следующие шаги:
    1. Перетащите выбранные поля в новую карточку.
    2. Наведите курсор над областью размещения Диаграмма.
    3. Перенесите выбранные поля в Ящичковую диаграмму.
Подсказка:

Также можно построить диаграммы с помощью меню Диаграмма над панелью данных или кнопки Тип визуализации Тип визуализации на существующей карточке. В меню Диаграммы будут доступны только диаграммы, которые применимы к имеющейся выборке данных. В меню Тип визуализации будут только подходящие варианты визуализаций (карты, диаграммы или таблицы).

Диаграммы рассеяния также можно создавать с помощью команды Просмотр диаграммы рассеяния, которая открывается с помощью кнопки Действие Действие в разделе Найти ответы > Как связаны данные?

Примечания по использованию

Кнопка Опции слоя Легенда открывает панель Опции слоя. Вы можете использовать панель Опции слоя, чтобы посмотреть легенду, изменить тип символа на диаграмме и стиль самой диаграммы.

На вкладке Легенда Легенда отображаются символы и значения диаграммы. Чтобы поменять цвет, связанный со значением, щелкните символ и выберите на палитре нужный цвет, либо введите его шестизначный код (доступно при применении переменной Цвет по). Кнопка Всплывающая легенда Всплывающая легенда позволяет отобразить легенду как отдельную карточку на странице. Вкладку Легенда можно использовать для выбора объектов на диаграмме.

Вкладка Символы Символы используется для изменения параметров Окрасить по и Тип символа. Поле Окрасить по используется для оформления диаграммы по уникальным значениям, это поле должно быть строковым. Параметр Тип символа используется для переключения стиля диаграммы между точками и бинами. Если Тип символа задан как Бины, то будут доступны следующие дополнительные конфигурации:

  • Задайте размер бинов, настроив Разрешение. Значение Разрешения по умолчанию вычисляется для набора данных на основе правила Стерджеса.
  • Укажите параметр Значение перехода. Если число точечных объектов в экстенте диаграммы меньше, чем значение перемещения, то диаграмма будет отображать точечные объекты. Если же число точек в экстенте диаграммы больше, чем значение перемещения, или равно этому порогу, то такая диаграмма будет в бинах. Значением перехода по умолчанию является 2 000.
  • Параметр Показать всплывающие окна определяет, будут ли всплывающие окна появляться при наведении на бин, и какая информация будет в них отображена.

Вкладка Оформление Оформление используется для настройки следующих свойств символа:

  • Для точек вы можете изменить размер символа, цвет символа (только для единого символа), толщину и цвет контура, а также прозрачность слоя.
  • Для бинов вы можете изменить палитру цветов, толщину и цвет контура бина, а также прозрачность слоя.

Линия лучшего соответствия добавляется в точечную диаграмму нажатием кнопки Статистика диаграммы Статистика диаграммы. График линии наилучшего соответствия может быть Линейным, Экспоненциальным или Полиномиальным. Уравнение линии наилучшего соответствия и значение R2 будут всегда отображаться на диаграмме.

СтатистикаОписание

Линейная

Линейная регрессия пытается провести прямую через набор значений так, чтобы расстояния между значениями и этой прямой были наименьшим. Линия с положительным уклоном (идущая из левой нижней в правую верхнюю часть диаграммы) говорит о наличии позитивного линейного отношения (корреляции). Положительное отношение означает, что оба значения увеличиваются. Линия с отрицательным уклоном говорит о наличии отрицательного линейного отношения (корреляции). Отрицательное отношение означает, что при уменьшении одного значения другое увеличивается. Для расчета отношения могут использоваться измерения качества отношения, например, R2. Чем ближе значение к 1, тем сильнее взаимосвязь.

Экспоненциальная

Вычисляет экспоненциальную (восходящую) кривую наибольшего соответствия модели нелинейного отношения данных (R2 для линейной регрессии равно или близко к 0).

Полиномная

Вычисляет кривую наибольшего соответствия для нелинейного отношения данных (R2 для линейной регрессии равно или близко к 0). По умолчанию для вычисления используется уравнение полинома второй степени. Можно использовать уравнение полинома третьей или четвертой степени.

Вы можете добавить третью числовую переменную или переменную доля/отношение к вашей точечной диаграмме, если выберите поле на панели данных и перетащите его в карточку с построенной точечной диаграммой (недоступно для точечной диаграммы с символами бинов). В результате получится точечная диаграмма с пропорциональными символами, где размер точек представляет величину данных третей переменной.

Используйте кнопку Переключить оси Переключить ось для переключения переменных по осям x и y.

Нажмите кнопку Тип визуализации Тип визуализации, чтобы переключаться между точечной диаграммой и другими вариантами визуализации, например, карточкой KPI или суммарной таблицей.

Используйте кнопку Перевернуть карточку Перевернуть карточку, чтобы посмотреть обратную сторону карточки. Вкладка Информация о карточке Информация карточкипредоставляет информацию о данных на карточке, а вкладка Экспорт данных Экспорт данных позволяет пользователям экспортировать данные с карточки.

Щелкните ось x или y для переключения шкалы между Линейной и Логарифмической.

Ограничения

Бинированные точечный диаграммы недоступны для некоторых удаленных векторных слоев. Если удаленный векторный слой не поддерживает бинированные точечные диаграммы, можно скопировать слой в рабочую книгу и создать бинированную точечную диаграмму с помощью копии.

Экспорт данных недоступен для бинированных точечных диаграмм. Вы должны задать Тип символа как Единый символ, чтобы разрешить экспорт данных с обратной стороны точечной диаграммы.

Инструменты масштабирования и инструменты выборки недоступны в опубликованных отчетах для бинированных точечных диаграмм с более чем 100 000 объектов.