Klasyfikacja danych to proces, w ramach którego stopniowane wartości liczbowe są grupowane w zakresy, a każdy zakres klasyfikacji jest reprezentowany przez odcień lub kolor na skali barw albo przez rozmiar symbolu.
Zastosowana metoda klasyfikacji zależy od rodzaju używanych danych i od informacji, jakie ma przekazywać mapa.
Naturalne przerwy
Klasyfikacja naturalnych przerw tworzy klasy na podstawie naturalnych grup nieodłącznie związanych z danymi. To jest klasyfikacja domyślna.
Używaj klasyfikacji Naturalne przerwy, jeśli chcesz podkreślić naturalne grupowania w danych. Nie używaj klasyfikacji Naturalne przerwy do porównywania map utworzonych za pomocą różnych danych. Na przykład użyj klasyfikacji Naturalne przerwy do porównania liczby przestępstw w dzielnicach określonego miasta. Łączne liczby przestępstw zostaną pogrupowane w taki sposób, że dzielnice o podobnej liczbie przestępstw będą prezentowane za pomocą symboli o tym samym rozmiarze.
Równe przedziały
Klasyfikacja równych przedziałów dzieli zakres wartości atrybutów na równej wielkości podzakresy.
Klasyfikacja Równe przedziały podkreśla wielkość atrybutu w stosunku do innych wartości. Używaj klasyfikacji Równe przedziały w przypadku danych o znanych zakresach. Na przykład użyj klasyfikacji Równe przedziały do porównania wartości sprzedaży ogółem między oddziałami sklepów. W przypadku stosowania czterech koszy sklepy zostaną podzielone na 25-procentowe zakresy.
Kwantyle
Klasyfikacja kwantylowa dzieli atrybuty na kosze z równą liczbą obiektów.
Klasyfikacja kwantylowa może zniekształcić wygląd mapy przez umieszczenie podobnych wartości w różnych klasach. Klasyfikacji kwantylowej należy używać w przypadku danych, które są stosunkowo jednolite. Klasyfikacji kwantylowej można też używać do wizualnego szeregowania. Na przykład użyj przedziałów kwantylowych do porównania emisji dwutlenku węgla między poszczególnymi krajami w określonym roku. Jeśli zestaw danych zawiera informacje o emisji na obszarze obejmującym 100 krajów i zostanie zastosowanych 10 koszy, możliwe będzie rozróżnienie grup krajów emitujących dwutlenek węgla (10 o największej emisji, 10 o najmniejszej emisji itp.), ale rozróżnienie w obrębie grupy nie będzie możliwe.
Odchylenie standardowe
Klasyfikacja wg odchylenia standardowego pozwala klasyfikować obiekty na podstawie tego, jak bardzo ich atrybuty różnią się od średniej.
Klasyfikacja według odchylenia standardowego sprawdza się najlepiej w przypadku zestawów danych o rozkładzie normalnym, a także w analizach, w których istotna jest wartość średnia lub odchylenie od wartości średniej. Na przykład użyj klasyfikacji według odchylenia standardowego i rozbieżnej skali barw do porównania oczekiwanej średniej długości życia w różnych krajach. Kraje o najwyższej i najniższej oczekiwanej średniej długości życia będą wyświetlane w różnych odcieniach jasności. Im bliżej średniej dla całego świata oczekiwanej długości życia znajdzie się klasa, tym jaśniejsze kolory zostaną użyte.
Wskazówka:
Spróbuj połączyć klasyfikację według odchylenia standardowego z rozbieżną skalą barw dla kartogramów. Rozbieżna skala barw przypisuje ciemne odcienie na niższych i wyższych krańcach oraz kolor neutralny pośrodku.
Niesklasyfikowane
Klasyfikacja typu Niesklasyfikowane pozwala wyświetlać dane liczbowe na skali ciągłej, a nie w dyskretnych klasach.
Używaj klasyfikacji Niesklasyfikowane, jeśli chcesz zobaczyć stopniowe zmiany w danych. Na przykład użyj niesklasyfikowanej skali barw, aby nadać styl pomiarom średniej temperatury dokonywanym w określonym przedziale czasu w regularnie rozmieszczonych stacjach meteorologicznych. Punkty będą wskazywać stopniowe zmiany temperatury na badanym obszarze.
Manualnie
Klasyfikacja ręczna dodaje niestandardowe, odpowiednie dla danych podziały klas.
Klasyfikacja ręczna może być używana do tworzenia nowych podziałów klas lub modyfikowania podziałów utworzonych przy użyciu innej metody klasyfikacji. Można na przykład sklasyfikować dane przy użyciu równych interwałów i użyć ręcznej klasyfikacji, aby zmodyfikować podziały na zaokrąglone liczby.
Używaj klasyfikacji ręcznej, jeśli znane są zakresy, które należy zastosować do danych. Na przykład w przypadku tworzenia wielu map z tymi samymi koszami. Na przykład użyj klasyfikacji ręcznej w celu porównania liczby niezasiedlonych domów w poszczególnych dzielnicach miasta na przestrzeni czasu. Te same kosze można zastosować do obu map, co pozwoli na stosowanie wzorców i porównań nieobarczonych fałszywymi założeniami wynikającymi z różnic między klasyfikacjami.
Zasoby
Aby dowiedzieć się więcej, skorzystaj z następujących zasobów: