Mit "k-Means-Cluster ermitteln" werden unter Verwendung des k-Means-Algorithmus natürliche Cluster von Features gefunden, die entweder auf Orts- oder Attributwerten basieren. Durch den Algorithmus werden die Features so klassifiziert, dass sie innerhalb eines Clusters möglichst ähnlich sind, während die Cluster als Ganzes möglichst verschieden voneinander sind.
Beispiele
Eine Nichtregierungsorganisation sammelt Daten über nicht mehr genutzte Fischfanggeräte und anderen Schrott im Meer. Die Position des Schrotts kann analysiert werden, um größere Ansammlungen zu finden, was der Organisation dabei helfen kann, die Hauptverursacher dieser Verunreinigung zu bestimmen.
Kunden eines Einzelhandelsgeschäfts können anhand ihrer demografischen Eigenschaften und ihres Kaufverhaltens analysiert werden. Anhand von Clustern, die auf Eigenschaften wie verfügbares Einkommen und Ausgaben basieren, kann eine Marketingstrategie für das Geschäft entworfen werden.
Verwenden von k-Means-Clustern
"k-Means-Cluster ermitteln" kann für Karten-, Diagramm- oder Tabellen-Kacheln mithilfe von Punkt-, Linien- oder Flächen-Features ausgeführt werden.
Gehen Sie zum Ausführen von "k-Means-Cluster ermitteln" wie folgt vor:
- Klicken Sie bei Bedarf auf die Karten-Kachel, um sie auszuwählen. Eine Kachel ist aktiv, wenn die Symbolleiste und die Schaltfläche Aktion angezeigt werden.
- Klicken Sie auf die Schaltfläche Aktion, und führen Sie einen der folgenden Schritte aus:
- Klicken Sie für eine Karten-Kachel auf der Registerkarte Räumliche Analyse auf k-Means-Cluster ermitteln.
- Klicken Sie für Diagramm- und Tabellen-Kacheln auf Wie verteilt sich etwas? und dann auf k-Means-Cluster ermitteln.
- Wählen Sie für Layer auswählen den Layer aus, für den Sie Cluster ermitteln möchten.
- Wählen Sie unter Analysefelder eine der folgenden Optionen aus:
- Wählen Sie ein Positionsfeld aus, wenn Sie k-Means-Cluster ermitteln räumlich ausführen möchten.
- Wählen Sie ein oder mehrere Zahlenfelder aus, wenn Sie k-Means-Cluster ermitteln nicht räumlich ausführen möchten.
- Blenden Sie Zusätzliche Optionen ein, und geben Sie einen Wert für den Parameter Anzahl der Cluster ein, falls erforderlich.
- Klicken Sie auf Ausführen.
Verwendungshinweise
Mit dem Parameter Layer auswählen kann das Dataset ausgewählt werden, in dem die Cluster gesucht werden sollen. Das Dataset kann Punkt-, Linien- oder Flächen-Features haben, oder es kann eine nicht räumliche Tabelle sein (nur möglich, wenn die Funktion in einem Diagramm oder einer Tabelle verwendet wird).
Mit dem Parameter Analysefelder wird das Feld ausgewählt, anhand dessen die Cluster gesucht werden. Das Feld kann entweder ein Positionsfeld sein – in diesem Fall basieren die Cluster auf dem geographischen Standort – oder ein oder mehrere Zahlen- oder Anteil/Verhältnis-Felder – in diesem Fall basieren die Cluster auf der Ähnlichkeit von Attributen. Eine Kombination aus Positions- und Zahlen- oder Anteil/Verhältnis-Feldern wird nicht unterstützt.
Sie können Zusätzliche Optionen einblenden, um die Parameter Anzahl der Cluster anzuzeigen. Wenn für Ihre Analyse eine bestimmte Anzahl von Clustern erforderlich ist, geben Sie diesen Wert in den Parameter Anzahl der Cluster ein. Wenn kein Wert eingegeben wird, wird eine Anzahl von Clustern mithilfe des Davies-Bouldin-Index berechnet, der in Davies and Bouldin (1979) beschrieben ist und der die Ähnlichkeiten innerhalb eines Clusters und die Unterschiede zwischen verschiedenen Clustern optimiert.
Einschränkungen
Dieses Werkzeug wird für schreibgeschützte Verbindungen mit Google BigQuery, Snowflake und Datenbankplattformen, die nicht standardmäßig unterstützt werden, nicht unterstützt.
Kreuzfilter, Filter-Widgets und Zeitfilter-Widgets können auf die Ergebnisse der Suche nach k-Means-Clustern angewendet werden. Das Werkzeug wird jedoch nicht bei jeder Änderung des Filters erneut ausgeführt.
Referenzen
Davies, David L. und Donald W. Bouldin. 1979. A Cluster Separation Measure. IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-1 (2) (April): 224–227.https://doi.org/10.1109/TPAMI.1979.4766909.