Funkcja Znajdź klastry k-średnich znajduje naturalne klastry obiektów na podstawie lokalizacji lub wartości atrybutów przy użyciu algorytmu k-średnich. Algorytm klasyfikuje obiekty w ten sposób, że obiekty w klastrze są jak najbardziej podobne do siebie, natomiast same klastry maksymalnie różnią się od siebie.
Przykłady
Instytucja pozarządowa gromadzi dane dotyczące porzuconego sprzętu do połowów i innych nadmorskich odpadów. Na podstawie analizy lokalizacji odpadów można identyfikować ich klastry, co pomoże instytucji w ustaleniu głównych źródeł porzuconego sprzętu i odpadów.
Możliwa jest analiza klientów sklepów detalicznych na podstawie informacji demograficznych i wzorców zakupowych. Klastry określone na podstawie takich właściwości, jak dochód rozporządzalny i wydatki, można wykorzystać przy opracowywaniu strategii marketingowej sklepu.
Korzystanie z funkcji Znajdź klastry k-średnich
Funkcję Znajdź klastry k-średnich można uruchomić na kartach mapy, diagramu lub tabeli, korzystając z obiektów punktowych, liniowych lub powierzchniowych.
Aby uruchomić funkcję analityczną Znajdź klastry k-średnich, wykonaj następujące czynności:
- Kliknij kartę, aby ją aktywować, jeśli to konieczne.
Karta jest aktywna, gdy jest wyświetlany pasek narzędziowy i przycisk Działanie.
- Kliknij przycisk Działanie i wykonaj jedną z następujących czynności:
- W przypadku karty mapy na karcie Analiza przestrzenna kliknij opcję Znajdź klastry k-średnich.
- W przypadku kart diagramów i tabel kliknij opcję Jaki jest rozkład i kliknij opcję Znajdź klastry k-średnich.
- W polu Wybierz warstwę wybierz warstwę, dla której chcesz znaleźć klastry.
- W polu Pola analizy wybierz jedną z następujących opcji:
- Aby uruchomić funkcję Znajdź klastry k-średnich przestrzennie, wybierz pole lokalizacji.
- Aby uruchomić funkcję Znajdź klastry k-średnich nieprzestrzennie, wybierz jedno lub większą liczbę pól liczbowych.
- Rozwiń Opcje dodatkowe i, jeśli to konieczne, wprowadź wartość parametru Liczba klastrów.
- Kliknij przycisk Uruchom.
Uwagi dotyczące korzystania
Parametr Wybierz warstwę umożliwia wybór zestawu danych, w którym mają być wyszukiwane klastry. Zestaw danych może zawierać obiekty punktowe, liniowe lub poligonowe albo może to być tabela nieprzestrzenna (dostępna podczas korzystania z tej funkcji z poziomu diagramu lub tabeli).
Parametr Pola analizy umożliwia wybór pola, na podstawie którego tworzone są klastry. Może to być pole lokalizacji — w takim przypadku klastry będą tworzone na podstawie lokalizacji geograficznej. Może to być również jedno lub większa liczba pól liczbowych lub wskaźnika/współczynnika — w takim przypadku klastry będą tworzone na podstawie podobieństwa między atrybutami. Kombinacja pól lokalizacji oraz pól liczbowych lub wskaźnika/współczynnika nie jest obsługiwana.
Można rozwinąć Opcje dodatkowe, aby wyświetlić parametr Liczba klastrów. Jeśli na potrzeby analizy wymagane jest określenie konkretnej liczby klastrów, należy wprowadzić tę wartość w parametrze Liczba klastrów. Jeśli nie zostanie podana żadna wartość, liczba klastrów zostanie obliczona na podstawie indeksu Daviesa-Bouldina opisanego w pracy Davies & Bouldin (1979), który optymalizuje podobieństwa w obrębie klastra i różnice między klastrami.
Ograniczenia
Narzędzie Znajdź klastry k-średnich nie jest obsługiwane w przypadku połączeń tylko do odczytu z platformami Google BigQuery, Snowflake oraz platformami bazy danych, które nie są od razu gotowe do użycia.
Filtry krzyżowe i filtry wstępnie zdefiniowane można zastosować do wyników zwracanych przez narzędzie Znajdź klastry k-średnich, ale nie będzie ono ponownie uruchamiane po każdej zmianie filtru.
Odniesienia
Davies, D. L., & Bouldin, D. W. (1979). A Cluster Separation Measure. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1(2), 224–227.https://doi.org/10.1109/TPAMI.1979.4766909.