Tworzenie i używanie diagramu pudełkowego

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Diagramy pudełkowe umożliwiają szybkie wizualne podsumowanie zmienności wartości w zestawie danych. Przedstawiają medianę, górny i dolny kwartyl, wartości minimalne i maksymalne, a także wszystkie wartości odstające w zestawie danych. Wartości odstające mogą ujawniać błędy lub nietypowe wystąpienia w danych. Diagram pudełkowy tworzy się za pomocą pola liczbowego lub pola wskaźnika/współczynnika na osi y.

Diagramy pudełkowe umożliwiają uzyskanie odpowiedzi na takie pytania dotyczące danych, jak: Jaki jest rozkład moich danych? Czy w zestawie danych istnieją elementy odstające? Jakie są różnice w rozkładzie kilku serii w zestawie danych?

Przykłady

Analityk rynku bada rentowność sieci handlowej. Diagram pudełkowy dochodu rocznego każdego sklepu może służyć do określenia rozkładu wartości sprzedaży wraz z wartościami minimalnymi, maksymalnymi i medianą.

Diagram pudełkowy dochodu sklepu

Powyższy diagram pudełkowy pokazuje, że mediana wartości sprzedaży jest równa 1 111 378 $ (widoczne po umieszczeniu kursora myszy nad diagramem lub po odwróceniu karty za pomocą przycisku Odwróć kartę Odwróć kartę). Rozkład wygląda na stosunkowo równomierny, z medianą leżącą pośrodku prostokąta i „wąsami” o podobnych rozmiarach. Występują także dolne i górne elementy odstające wskazujące analitykowi sklepy dobrze funkcjonujące i sklepy nierentowne.

Aby głębiej wniknąć w strukturę danych, analityk postanawia utworzyć indywidualne diagramy pudełkowe dla poszczególnych regionów, w których sklepy są zlokalizowane. Czyni to, zmieniając ustawienie pola Grupuj według na Region. W rezultacie zostaną utworzone cztery indywidualne diagramy pudełkowe, które można ze sobą porównywać w celu wychwycenia różnic między danymi pochodzącymi z poszczególnych regionów.

Diagram pudełkowy dochodów sklepów w poszczególnych regionach

Na podstawie tych diagramów pudełkowych analityk może stwierdzić, że pomiędzy regionami występują niewielkie różnice, w czterech diagramach pudełkowych prostokąty mają podobne rozmiary, a dla wszystkich regionów występują elementy odstające względem zarówno wartości minimalnej, jak i maksymalnej. Jednak wąsy dla regionów północnych i środkowych są nieco bardziej spójne w stosunku do obszaru zatoki i regionów południowych, co wskazuje, że w tych regionach rentowność jest bardziej wyrównana niż w regionach pozostałych. Na obszarze zatoki i w regionach południowych wąsy są trochę dłuższe, co wskazuje, że w tych regionach występują zarówno sklepy o wysokiej rentowności, jak też sklepy nierentowne. Analityk może chcieć dokładniej przeanalizować te dwa regiony, aby poznać przyczynę takich różnic w rentowności.

Tworzenie diagramu pudełkowego

Aby utworzyć diagram pudełkowy, wykonaj poniższe czynności:

  1. Wybierz jedną z następujących opcji danych:
    • Pole liczbowe Pole liczbowe bądź pole wskaźnika/współczynnika Pole wskaźnika/współczynnika.
    • Pole liczbowe Pole liczbowe bądź pole wskaźnika/współczynnika Pole wskaźnika/współczynnika i dodatkowo pole znakowe Pole znakowe.
    Notatka:

    Można wyszukiwać pola przy użyciu paska wyszukiwania na panelu danych.

  2. Utwórz diagram pudełkowy, wykonując poniższe czynności:
    1. Przeciągnij wybrane pola do nowej karty.
    2. Umieść wskaźnik myszy nad strefą upuszczania Diagram.
    3. Upuść wybrane pola na obszar Diagram pudełkowy.
Wskazówka:

Diagramy można utworzyć, korzystając z menu Diagram nad panelem danych lub przycisku Typ wizualizacji Typ wizualizacji na istniejącej karcie. W przypadku menu Diagram zostaną włączone tylko diagramy zgodne z wyborem danych. W przypadku menu Typ wizualizacji zostaną wyświetlone tylko zgodne wizualizacje (w tym mapy, diagramy lub tabele).

Notatka:

Diagramy pudełkowe utworzone na podstawie zestawów danych bazy danych muszą mieć co najmniej pięć rekordów. Diagramy pudełkowe o mniej niż pięciu rekordach występują najczęściej przy grupowaniu z użyciem pola znakowego lub po zastosowaniu filtru do zestawu danych albo do karty. Zestawy danych bazy danych są dostępne za pośrednictwem połączeń z bazą danych w aplikacjach Insights in ArcGIS Enterprise i Insights desktop.

Uwagi dotyczące korzystania

Przycisk Opcje warstwy Legenda otwiera panel Opcje warstwy. Panel Opcje warstwy zawiera następujące funkcje:

  • Karta Legenda Legenda staje się dostępna po zastosowaniu pola Grupuj według do osi X na diagramie. Jeśli używane jest pole Grupuj według, zostaną utworzone sąsiadujące diagramy pudełkowe przedstawiające rozkład danych w poszczególnych kategoriach. Przycisk wywoływania legendy Legenda pływająca umożliwia wyświetlenie legendy jako osobnej karty na stronie. Przy użyciu legendy można dokonywać wyborów na diagramie. Aby zmienić kolor powiązany z wartością, kliknij symbol i wybierz kolor z palety lub wprowadź wartość szesnastkową.
  • Na karcie Wygląd Wygląd można zmienić kolor symbolu na diagramie (tylko pojedynczy symbol).

Przycisk Typ wizualizacji Typ wizualizacji umożliwia bezpośrednie przełączanie między diagramem pudełkowym, a innymi wizualizacjami, takimi jak mapa z symbolami stopniowanymi, tabela podsumowania lub histogram. Jeśli diagram pudełkowy zawiera pole Grupuj według, wizualizację można zmienić na diagramy, takie jak diagram liniowy lub diagram kolumnowy.

Użyj przycisku Odwróć kartę Odwróć kartę, aby wyświetlić tylną część karty. Karta Informacje o karcie Informacje o karcie udostępnia informacje na temat danych zawartych na karcie, a karta Eksport danych Eksport danychumożliwia użytkownikom eksportowanie danych z karty.

Najważniejszą funkcją diagramu pudełkowego jest określanie elementów odstających. Elementy odstające to wartości dużo większe lub dużo mniejsze od pozostałych danych. „Wąsy” na diagramie pudełkowym reprezentują wartości progowe. Wartości leżące poza nimi są uważane za elementy odstające. Jeśli nie występują elementy odstające, wąsy rozciągają się od wartości minimalnej do maksymalnej w zestawie danych. W aplikacji Insights zakresy wartości dolnych i górnych elementów odstających są wskazywane na diagramie pudełkowym w postaci kółek połączonych liniami kropkowanymi.

Każdą statystykę lub zakres na diagramie pudełkowym można wybrać, klikając diagram.

Przy tworzeniu diagramu pudełkowego do panelu danych zostanie dodany wynikowy zestaw danych Wyniki zawierający pola wejściowe i statystyki wynikowe. Wynikowy zestaw danych może być wykorzystany do znajdowania odpowiedzi za pomocą analizy nieprzestrzennej przy użyciu przycisku Działanie Działanie.

Jak działają diagramy pudełkowe

Diagram pudełkowy składa się z następujących komponentów:

Diagram z etykietami diagramu pudełkowego

EtykietaSkładnikOpis
1

Wąs

Przedział danych mniejszych od pierwszego kwartylu lub większych od trzeciego kwartylu. Każdy wąs zawiera 25 procent danych. Typowo wąsy nie powinny przekraczać wartości 1,5 razy większej od IQR, co określa wartość progową dla elementów odstających.

2

Prostokąt

Przedział danych między pierwszym i trzecim kwartylem. 50 procent danych leży w tym przedziale. Przedział danych między pierwszym a trzecim kwartylem jest także znany pod nazwą Inter Quartile Range (przedział między kwartylami - IQR).

3

Maksimum

Największa wartość w zestawie danych lub największa wartość niewykraczająca poza wartość progową wyznaczoną przez wąsy.

4

Trzeci kwartyl

Wartość, od której 75 procent danych ma mniejszą wartość, a 25 procent danych wartość większą.

5

Mediana

Środkowa liczba w zestawie danych. Połowa liczb ma większą wartość niż mediana, a połowa wartość mniejszą. Medianę można także nazwać drugim kwartylem.

6

Pierwszy kwartyl

Wartość, od której 25 procent danych ma mniejszą wartość, a 75 procent danych wartość większą.

7

Minimum

Najmniejsza wartość w zestawie danych lub najmniejsza wartość niewykraczająca poza wartość progową wyznaczoną przez wąsy.

8

Elementy odstające

Wartości danych wykraczające poza wartości progowe wyznaczone przez wąsy.