Ящичковая диаграмма даёт быструю наглядную сводку вариабельности значений в наборе данных. Они показывают медиану, верхний и нижний квартили, минимальное и максимальное значения, а также все выбросы в наборе данных. Выбросы могут вскрыть ошибки или необычные случаи в данных. Ящичковая диаграмма создается с помощью числового поля чисел или поля доля/отношение на оси У.
Ящичковые диаграммы помогут найти ответы на следующие вопросы: Как распределены данные? Есть ли выбросы в наборе данных? Каковы вариации в распространении в нескольких сериях в наборе данных?
Примеры
Аналитик рынка изучает успешность торговой сети. Ящичковая диаграмма годовой выручки по каждому магазину может помочь в определении распределения продаж, включая минимальное, максимальное и медианное значения.
На ящичковой диаграмме на рисунке выше показано медианное значение объема продаж $1,111,378 (показывается при наведении указателя мыши на диаграмму или при нажатии кнопки Перевернуть карточку для переворачивания карточки). Распределение выглядит примерно одинаковым, поскольку медиана находится примерно в середине ящика и усов почти одинакового размера. Также есть выбросы высоких и низких значений, которые дают аналитику понять, какие магазины недо- или перевыполняют план.
Более подробно о компонентах ящичковой диаграммы
Для более глубокого изучения данных аналитику нужно создать отдельные ящичковые диаграммы для каждого региона, в котором присутствует торговая сеть. Это можно сделать, изменив поле Группировать по на Регион. В результате появится 4 отдельных ящичковых диаграммы, которые можно использовать для сравнения информации между регионами.
На основании этих ящичковых диаграмм аналитик может понять, что различия между регионами небольшие : медиана везде примерно одинаковая, ящички почти одного размера, а выбросы находятся на обоих концах. Однако усы для северного и центрального регионов немного более компактны, чем для прибрежного и южного, это говорит о том, что в этих регионах успешность торговых точек более постоянна. В южном и прибрежном районах усы немного длиннее, это говорит о том, что там есть магазины, которые как не добирают выручку, так и перевыполняют план. Дальше можно сконцентрироваться на этих двух районах, чтобы понять, почему там такие различия в успешности магазинов.
Создание ящичковой диаграммы
Для создания ящичковой диаграммы выполните следующие шаги:
- Выберите одну из следующих комбинаций данных:
- Числовое поле или поле доли/отношения .
- Числовое поле или поле доли/отношения плюс текстовое поле .
Примечание:
Вы можете выполнять поиск по полям с помощью строки поиска в панели данных.
- Создайте диаграмму, выполнив следующие шаги:
- Перетащите выбранные поля в новую карточку.
- Наведите курсор над областью размещения Диаграмма.
- Перенесите выбранные поля в Ящичковую диаграмму.
Подсказка:
Также можно построить диаграммы с помощью меню Диаграмма над панелью данных или кнопки Тип визуализации на существующей карточке. В меню Диаграммы будут доступны только диаграммы, которые применимы к имеющейся выборке данных. В меню Тип визуализации будут только подходящие варианты визуализаций (карты, диаграммы или таблицы).
Примечание:
Ящичковая диаграмма, построенная из набора данных базы данных должна содержать хотя бы пять записей. Ящичковые диаграммы с количеством записей меньше пяти чаще всего случаются при группировке диаграммы на основании текстового поля или после применения фильтра к набору данных или карточки. Наборы данных базы данных доступны в Insights in ArcGIS Enterprise и Insights desktop.
Примечания по использованию
Эта визуализация создает результирующий набор данных на панели данных, который включает поля, использованные для создания диаграммы. Результирующий набор данных можно использовать для создания дополнительных визуализаций, переименования полей на осях диаграммы или во всплывающих окнах, или применения фильтров к диаграмме.
Ключевой момент ящичковой диаграммы – выявление выбросов. Выбросы – это значения, которые гораздо больше или меньше всех остальных данных. "Усики" на ящичковой диаграмме представляют ограничители, за пределами которых значения считаются выбросами. Если выбросов нет, они протягиваются до минимального и максимального значений набора данных. В Insights диапазон нижнего и верхнего значений выбросов обозначается кружочками, присоединенными пунктирными линиями.
Если используется поле Группировать по, создаются расположенные рядом друг с другом ящичковые диаграммы, каждая из которых представляет собой распространение данных в каждой категории.
Любую статистику или диапазон на ящичковой диаграмме легко выбрать, щёлкнув на диаграмме.
Используйте кнопку Опции слоя , чтобы открыть панель Опции слоя и выполнить следующее для обновления параметров конфигурации:
Используйте вкладку Легенда , чтобы просмотреть символы на диаграмме. Всплывающая кнопка легенды отобразит легенду как отдельную карточку на странице. Для создания выборки на диаграмме можно использовать легенду (доступно для уникальных символов).
Чтобы поменять цвет, связанный со значением, нажмите на символ и выберите в палитре нужный цвет, либо введите его шестизначный код. Изменение символа на вкладке Легенда доступно только для уникальных символов.- На вкладке Оформление можно поменять цвет диаграммы (только единый цвет).
Используйте кнопку Фильтр карточки , чтобы удалить ненужные данные с карточки. Фильтры могут применяться ко всем строковым, числовых полям, полям доля/отношение и полям дата/время. Фильтр карточки не влияет на другие карточки, использующие этот набор данных.
Используйте кнопку Инструменты выборки , чтобы выбрать объекты на диаграмме с помощью инструментов выбора отдельного объекта, либо для инвертирования выборки.
Используйте кнопку Тип визуализации для переключения между ящичковой диаграммой и прочими методами визуализации, например, градуированными символами на карте, суммарной таблицей или гистограммой. Если ящичковая диаграмма включает поле Группировать по, тогда визуализацию можно изменить на такие диаграммы, как линейный график или столбчатая диаграмма.
Используйте кнопку Развернуть , чтобы увеличить карточку. Другие карточки на странице будут уменьшены до значков. Карточку можно вернуть к прежнему размеру при помощи кнопки Восстановить обратно .
Используйте кнопку Включить кросс-фильтры , чтобы разрешить создание фильтров на карточке с использованием выборок на других карточках. Удаление кросс-фильтров производится с помощью кнопки Отключить кросс-фильтры .
Используйте кнопку Перевернуть карточку , чтобы посмотреть обратную сторону карточки. Вкладка Информация о карточке предоставляет информацию о данных на карточке, а вкладка Экспорт данных позволяет пользователям экспортировать данные с карточки.
Используйте кнопку Опции карточки , чтобы получить доступ к следующим опциям:
- Кнопка Оформление — Изменение цвета фона, цвета переднего плана и границы карточки.
- Кнопка Редактировать надписи — Создание пользовательских надписей для осей диаграммы. Чтобы изменить надписи, нажмите кнопку Редактировать надписи, затем щелкните ось, чтобы сделать ее редактируемой.
- Кнопка Порядок — переместить карточку вперед или назад относительно других карточек на странице.
- Кнопка Удалить — удаляет карточку со страницы. Если вы не собирались удалять карточку, вы можете восстановить ее с помощью кнопки Отменить .
Как строится ящичковая диаграмма
Ящичковая диаграмма состоит из следующих компонентов:
Подпись | Компонент | Описание |
---|---|---|
Ус | Диапазон данных, меньших первого квартиля и больших третьего квартиля. Каждый ус включает 25 процентов от данных. Как правило усы не могут быть больше, чем в 1.5 IQR, это определяет порог выбросов. | |
Ящичек | Диапазон данных между первой и третьей квартилями. 50 процентов данных попадет в этот диапазон. Диапазон между первой и третьей квартилями также называют Межквартильным диапазоном (IQR). | |
Максимум | Наибольшее значение в наборе данных или наибольшее значение, которое не выходит за пределы порога, определенного усами. | |
Квартиль 3 | Значение, при котором 75 процентов данных меньше него, а 25 процентов данных больше него. | |
Медиана | Среднее значение набора данных. Половина значений больше, чем медиана, а другая половина, соответственно, меньше. Медиану также иногда называют второй квартилью. | |
Квартиль 1 | Значение, при котором 25 процентов данных меньше него, а 75 процентов данных больше него. | |
Минимум | Наименьшее значение в наборе данных или наименьшее значение, которое не выходит за пределы порога, определенного усами. | |
Выбросы | Значения данных, которые выше или ниже пределов, заданных усами. |
Ресурсы
Изучите следующие ресурсы, чтобы узнать больше о диаграммах: