Datenklassifizierung ist ein Prozess, bei dem abgestufte numerische Werte in Bereiche gruppiert werden und jeder Klassifizierungsbereich durch einen Farbton eines Farbverlaufs oder eine Symbolgröße dargestellt wird.
Die verwendete Klassifizierungsmethode hängt davon ab, welche Daten Sie verwenden und welche Informationen Sie mit der Karte vermitteln möchten.
Natürliche Unterbrechungen
Mit der Klassifizierungsmethode "Natürliche Unterbrechungen" werden Klassen basierend auf natürlichen Gruppierungen innerhalb der Daten erstellt. Dies ist die Standard-Klassifizierung.
Verwenden Sie die Klassifizierungsmethode "Natürliche Unterbrechungen", wenn Sie die natürlichen Gruppierungen in den Daten hervorheben möchten. Verwenden Sie natürliche Unterbrechungen nicht, um aus verschiedenen Daten erstellte Karten zu vergleichen. Verwenden Sie natürliche Unterbrechungen beispielsweise zum Vergleichen der Anzahl an Straftaten in verschiedenen Vierteln einer Stadt. Die Straftatenzahlen werden so gruppiert, dass Viertel mit einer ähnlichen Anzahl mit der gleichen Symbolgröße wiedergegeben werden.
Gleiches Intervall
Mit der Klassifizierungsmethode "Gleiches Intervall" wird der Bereich der Attributwerte in gleich große Teilbereiche unterteilt.
Mit der Klassifizierungsmethode "Gleiches Intervall" wird die Menge eines Attributs im Verhältnis zu anderen Werten hervorgehoben. Sie eignet sich besonders für geläufige Datenbereiche. Verwenden Sie "Gleiche Intervalle", um die Gesamtverkäufe in den Filialen zu vergleichen. Wenn Sie vier Abschnitte nutzen, werden die Filialen in 25-Prozent-Bereiche aufgeteilt.
Quantil
Bei der Klassifizierung nach Quantilen werden die Attribute in Abschnitte mit jeweils gleicher Anzahl von Features unterteilt.
Durch die Klassifizierung nach Quantilen kann das Aussehen einer Karte verzerrt werden, da ähnliche Werte in verschiedenen Klassen platziert werden. Verwenden Sie die Klassifizierung nach Quantilen für relativ einheitliche Daten. Sie können die Klassifizierung nach Quantilen auch für die visuelle Einstufung verwenden. Verwenden Sie Quantil-Intervalle beispielsweise, um die Kohlenstoffemissionen einzelner Länder für ein bestimmtes Jahr zu vergleichen. Wenn das Dataset die Emissionen von 100 Ländern enthält und Sie 10 Abschnitte anwenden, können Sie die Gruppen von Kohlenstoffemittenten unterscheiden (die 10 Länder mit den höchsten Emissionen, die 10 Länder mit den niedrigsten Emissionen usw.), aber nicht die Emissionen innerhalb einer Gruppe.
Standardabweichung
Mit der Standardabweichungsklassifizierung wird ein Feature danach klassifiziert, um wie viel die Feature-Attribute vom Mittelwert abweichen.
Die Standardabweichungsklassifizierung eignet sich am besten für normal verteilte Datasets und für Analysen, bei denen der Mittelwert oder der Abstand vom Mittelwert wichtig ist. Verwenden Sie beispielsweise die Standardabweichung und einen divergierenden Farbverlauf zum Vergleichen der durchschnittlichen Lebenserwartung in verschiedenen Ländern. Die Länder mit der höchsten und niedrigsten Lebenserwartung werden mit unterschiedlichen dunklen Farbtönen dargestellt. Die Farben werden immer heller, je näher sich die Klassen an die mittlere globale Lebenserwartung annähern.
Tipp:
Sie können die Standardabweichungsklassifizierung mit einem divergierenden Farbverlauf für Choropleth-Karten kombinieren. Mithilfe von divergierenden Farbverläufen werden die oberen und unteren Extremwerte durch dunkle Farbtöne und der Mittelwert durch eine neutrale Farbe dargestellt.
Nicht klassifiziert
Mit der Klassifizierungsmethode "Nicht klassifiziert" werden numerische Daten statt in diskontinuierlichen Klassen auf einer kontinuierlichen Skala dargestellt.
Verwenden Sie die Methode "Nicht klassifiziert", wenn Sie graduelle Änderungen in den Daten betrachten möchten. Verwenden Sie beispielsweise den Farbverlauf "Nicht klassifiziert", um die durchschnittlichen Temperaturen aus Messungen in einem bestimmten Zeitraum an in regelmäßigen Abständen platzierten Wetterstationen farblich darzustellen. Die Punkte zeigen graduelle Temperaturänderungen im Untersuchungsgebiet.
Manuell
Bei der manuellen Klassifizierung werden für die Daten geeignete benutzerdefinierte Klassengrenzen hinzugefügt.
Die manuelle Klassifizierung kann zum Erstellen neuer Klassengrenzen oder zum Ändern der mit einer anderen Klassifizierungsmethode erstellten Unterbrechungen verwendet werden. Sie können beispielsweise die Daten mit gleichen Intervallen klassifizieren und dann die Klassengrenzen mit manueller Klassifizierung ändern, um die Zahlen zu runden.
Verwenden Sie die manuelle Klassifizierung, wenn es bekannte Bereiche gibt, die auf die Daten angewendet werden müssen, zum Beispiel beim Erstellen mehrerer Karten mit den gleichen Abschnitten. Verwenden Sie die manuelle Klassifizierung zum Vergleichen der Anzahl der leeren Häuser in den Vierteln einer Stadt im Zeitverlauf. Sie können die gleichen Abschnitte auf beide Karten anwenden, sodass Muster und Vergleiche ohne Verzerrungen aufgrund von Unterschieden in der Klassifizierung entstehen.
Ressourcen
Weitere Informationen finden Sie in den folgenden Quellen: