Найти кластеры К-средних находит естественные кластеры объектов на основе их местоположений или значений атрибутов, используя алгоритм К-средних. Алгоритм работает для классификации объектов, в связи с чем объекты в пределах кластера оказываются насколько возможно схожими, а кластеры между собой насколько возможно отличаются.
Примеры
Негосударственная организация собирает данные о забытых рыболовных снастях и других крупных морских отходах. Местоположение этих отходов можно проанализировать, чтобы найти их кластеры, это поможет организации определить основные источники забытого оборудования и отходов.
Можно проанализировать покупателей на основе их демографических характеристик и потребительского поведения. Кластеры на основе таких свойств, как, например, доходы и траты, можно использовать для разработки маркетинговой стратегии магазина.
Использование Найти кластеры К-средних
Найти кластеры К-средних можно запустить для карточек карты, диаграммы или таблицы, используя точечные, линейные или площадные объекты.
Выполните следующие действия, чтобы запустить Найти кластеры К-средних:
- При необходимости нажмите на карточку карты, чтобы активировать ее. Карточка активна, когда появляются панель инструментов и кнопка Действие .
- Щелкните кнопку Действие и выполните одно из следующего:
- Для карточки карты на вкладке Пространственный анализ щелкните Найти кластеры К-средних.
- Для карточек графика или таблицы щелкните Как это распределено и затем Найти кластеры К-средних.
- Для Выберите слой выберите слой, для которого требуется найти кластеры.
- Для Поля анализа выберите одну из следующих опций:
- Чтобы пространственно запустить Найти кластеры К-средних, выберите поле местоположения.
- Чтобы непространственно запустить Найти кластеры К-средних, выберите одно или несколько числовых полей.
- Разверните Дополнительные опции и введите значения для параметра Число кластеров, если необходимо.
- Щелкните Запустить.
Примечания по использованию
Параметр Выберите слой используется для выбора набора данных для поиска кластеров. В наборе данных могут быть точечные, линейные или полигональные объекты, либо это может быть непространственная таблица (которая доступна при использовании этой функции для графика или таблицы).
Параметр Поля анализа используется для выбора поля, на котором будут основываться кластеры. Это может быть поле местоположения, в таком случае кластеры будут основываться на географическом местоположении, либо одним и более полями доля/отношение, в таком случае кластеры будут основываться на сходности атрибутов. Комбинация полей местоположения и доля/отношение не поддерживается.
Вы можете развернуть Дополнительные опции, чтобы настроить параметр Число кластеров. Если для вашего анализа нужно определенное количество кластеров, введите это значение для параметра Число кластеров. Если этот параметр не задан, число кластеров будет вычислено с использованием индекса Дэвис-Боулдина, который описан в Davies and Bouldin (1979), он оптимизирует схожесть объектов внутри кластера и их различия между кластерами.
Ограничения
Этот инструмент не поддерживается для подключений только для чтения к Google BigQuery, Snowflake и платформ баз данных, которые не поддерживаются без настройки.
Кросс-фильтры, виджеты фильтров и виджеты временных фильтров могут быть применены к результатам Найти кластеры К-средних, но не будут повторно запускать инструмент каждый раз при изменении фильтра.
Справочная информация
Davies, David L., и Donald W. Bouldin. 1979. "A Cluster Separation Measure." IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-1, no. 2 (April): 224 - 227.https://doi.org/10.1109/TPAMI.1979.4766909.