Diagramy pudełkowe umożliwiają szybkie wizualne podsumowanie zmienności wartości w zestawie danych. Przedstawiają medianę, górny i dolny kwartyl, wartości minimalne i maksymalne, a także wszystkie wartości odstające w zestawie danych. Wartości odstające mogą ujawniać błędy lub nietypowe wystąpienia w danych. Diagram pudełkowy tworzy się za pomocą pola liczbowego lub pola wskaźnika/współczynnika na osi y.
Diagramy pudełkowe umożliwiają uzyskanie odpowiedzi na takie pytania dotyczące danych, jak: Jaki jest rozkład moich danych? Czy w zestawie danych istnieją elementy odstające? Jakie są różnice w rozkładzie kilku serii w zestawie danych?
Przykłady
Analityk rynku bada rentowność sieci handlowej. Diagram pudełkowy dochodu rocznego każdego sklepu może służyć do określenia rozkładu wartości sprzedaży wraz z wartościami minimalnymi, maksymalnymi i medianą.
Powyższy diagram pudełkowy pokazuje, że mediana wartości sprzedaży jest równa 1 111 378 $ (widoczne po umieszczeniu kursora myszy nad diagramem lub po odwróceniu karty za pomocą przycisku Odwróć kartę ). Rozkład wygląda na stosunkowo równomierny, z medianą leżącą pośrodku prostokąta i „wąsami” o podobnych rozmiarach. Występują także dolne i górne elementy odstające wskazujące analitykowi sklepy dobrze funkcjonujące i sklepy nierentowne.
Aby głębiej wniknąć w strukturę danych, analityk postanawia utworzyć indywidualne diagramy pudełkowe dla poszczególnych regionów, w których sklepy są zlokalizowane. Czyni to, zmieniając ustawienie pola Grupuj według na Region. W rezultacie zostaną utworzone cztery indywidualne diagramy pudełkowe, które można ze sobą porównywać w celu wychwycenia różnic między danymi pochodzącymi z poszczególnych regionów.
Na podstawie tych diagramów pudełkowych analityk może stwierdzić, że pomiędzy regionami występują niewielkie różnice, w czterech diagramach pudełkowych prostokąty mają podobne rozmiary, a dla wszystkich regionów występują elementy odstające względem zarówno wartości minimalnej, jak i maksymalnej. Jednak wąsy dla regionów północnych i środkowych są nieco bardziej spójne w stosunku do obszaru zatoki i regionów południowych, co wskazuje, że w tych regionach rentowność jest bardziej wyrównana niż w regionach pozostałych. Na obszarze zatoki i w regionach południowych wąsy są trochę dłuższe, co wskazuje, że w tych regionach występują zarówno sklepy o wysokiej rentowności, jak też sklepy nierentowne. Analityk może chcieć dokładniej przeanalizować te dwa regiony, aby poznać przyczynę takich różnic w rentowności.
Tworzenie diagramu pudełkowego
Aby utworzyć diagram pudełkowy, wykonaj poniższe czynności:
- Wybierz jedną z następujących opcji danych:
- Pole liczbowe bądź pole wskaźnika/współczynnika .
- Pole liczbowe bądź pole wskaźnika/współczynnika i dodatkowo pole znakowe .
Notatka:
Można wyszukiwać pola przy użyciu paska wyszukiwania na panelu danych.
- Utwórz diagram pudełkowy, wykonując poniższe czynności:
- Przeciągnij wybrane pola do nowej karty.
- Umieść wskaźnik myszy nad strefą upuszczania Diagram.
- Upuść wybrane pola na obszar Diagram pudełkowy.
Wskazówka:
Diagramy można utworzyć, korzystając z menu Diagram nad panelem danych lub przycisku Typ wizualizacji na istniejącej karcie. W przypadku menu Diagram zostaną włączone tylko diagramy zgodne z wyborem danych. W przypadku menu Typ wizualizacji zostaną wyświetlone tylko zgodne wizualizacje (w tym mapy, diagramy lub tabele).
Notatka:
Diagramy pudełkowe utworzone na podstawie zestawów danych bazy danych muszą mieć co najmniej pięć rekordów. Diagramy pudełkowe o mniej niż pięciu rekordach występują najczęściej przy grupowaniu z użyciem pola znakowego lub po zastosowaniu filtru do zestawu danych albo do karty. Zestawy danych bazy danych są dostępne za pośrednictwem połączeń z bazą danych w aplikacjach Insights in ArcGIS Enterprise i Insights desktop.
Uwagi dotyczące korzystania
Przycisk Opcje warstwy otwiera panel Opcje warstwy. Panel Opcje warstwy zawiera następujące funkcje:
- Karta Legenda staje się dostępna po zastosowaniu pola Grupuj według do osi X na diagramie. Jeśli używane jest pole Grupuj według, zostaną utworzone sąsiadujące diagramy pudełkowe przedstawiające rozkład danych w poszczególnych kategoriach. Przycisk wywoływania legendy umożliwia wyświetlenie legendy jako osobnej karty na stronie. Przy użyciu legendy można dokonywać wyborów na diagramie. Aby zmienić kolor powiązany z wartością, kliknij symbol i wybierz kolor z palety lub wprowadź wartość szesnastkową.
- Na karcie Wygląd można zmienić kolor symbolu na diagramie (tylko pojedynczy symbol).
Przycisk Typ wizualizacji umożliwia bezpośrednie przełączanie między diagramem pudełkowym, a innymi wizualizacjami, takimi jak mapa z symbolami stopniowanymi, tabela podsumowania lub histogram. Jeśli diagram pudełkowy zawiera pole Grupuj według, wizualizację można zmienić na diagramy, takie jak diagram liniowy lub diagram kolumnowy.
Użyj przycisku Odwróć kartę , aby wyświetlić tylną część karty. Karta Informacje o karcie udostępnia informacje na temat danych zawartych na karcie, a karta Eksport danych umożliwia użytkownikom eksportowanie danych z karty.
Najważniejszą funkcją diagramu pudełkowego jest określanie elementów odstających. Elementy odstające to wartości dużo większe lub dużo mniejsze od pozostałych danych. „Wąsy” na diagramie pudełkowym reprezentują wartości progowe. Wartości leżące poza nimi są uważane za elementy odstające. Jeśli nie występują elementy odstające, wąsy rozciągają się od wartości minimalnej do maksymalnej w zestawie danych. W aplikacji Insights zakresy wartości dolnych i górnych elementów odstających są wskazywane na diagramie pudełkowym w postaci kółek połączonych liniami kropkowanymi.
Każdą statystykę lub zakres na diagramie pudełkowym można wybrać, klikając diagram.
Przy tworzeniu diagramu pudełkowego do panelu danych zostanie dodany wynikowy zestaw danych zawierający pola wejściowe i statystyki wynikowe. Wynikowy zestaw danych może być wykorzystany do znajdowania odpowiedzi za pomocą analizy nieprzestrzennej przy użyciu przycisku Działanie .
Jak działają diagramy pudełkowe
Diagram pudełkowy składa się z następujących komponentów:
Etykieta | Składnik | Opis |
---|---|---|
Wąs | Przedział danych mniejszych od pierwszego kwartylu lub większych od trzeciego kwartylu. Każdy wąs zawiera 25 procent danych. Typowo wąsy nie powinny przekraczać wartości 1,5 razy większej od IQR, co określa wartość progową dla elementów odstających. | |
Prostokąt | Przedział danych między pierwszym i trzecim kwartylem. 50 procent danych leży w tym przedziale. Przedział danych między pierwszym a trzecim kwartylem jest także znany pod nazwą Inter Quartile Range (przedział między kwartylami - IQR). | |
Maksimum | Największa wartość w zestawie danych lub największa wartość niewykraczająca poza wartość progową wyznaczoną przez wąsy. | |
Trzeci kwartyl | Wartość, od której 75 procent danych ma mniejszą wartość, a 25 procent danych wartość większą. | |
Mediana | Środkowa liczba w zestawie danych. Połowa liczb ma większą wartość niż mediana, a połowa wartość mniejszą. Medianę można także nazwać drugim kwartylem. | |
Pierwszy kwartyl | Wartość, od której 25 procent danych ma mniejszą wartość, a 75 procent danych wartość większą. | |
Minimum | Najmniejsza wartość w zestawie danych lub najmniejsza wartość niewykraczająca poza wartość progową wyznaczoną przez wąsy. | |
Elementy odstające | Wartości danych wykraczające poza wartości progowe wyznaczone przez wąsy. |