Boxplots stellen eine kurze visuelle Zusammenfassung der Variabilität von Werten in einem Dataset bereit. Sie zeigen den Medianwert, die oberen und unteren Quartile, Minimum- und Maximumwerte sowie die Ausreißer im Dataset an. Ausreißer können Fehler oder ungewöhnliche Vorkommnisse in Daten aufdecken. Ein Boxplot wird anhand eines Zahlen- oder Anteil/Verhältnis-Feldes auf der Y-Achse erstellt.
Boxplots können Antworten auf beispielsweise folgende Fragen zu Ihren Daten liefern: Wie sind meine Daten verteilt? Enthält das Dataset Ausreißer? Welche Variationen ergeben sich für mehrere Reihen im Dataset?
Beispiele
Ein Marktforscher untersucht die Performance einer Einzelhandelskette. Ein Boxplot der jährlichen Einnahmen jeder Filiale kann zur Ermittlung der Umsatzverteilung verwendet werden, einschließlich der Minimal-, Maximal- und Medianwerte.
Im Boxplot oben lautet der Median-Umsatzwert 1.111.378 USD (dieser Wert ist beim Zeigen auf das Diagramm zu sehen oder durch Klicken auf die Schaltfläche Kachel umdrehen , wodurch die Kachel umgedreht wird). Die Verteilung scheint recht gleichmäßig zu sein, da sich der Medianwert in der Mitte der Box befindet und die Whiskers etwa gleich groß sind. Es gibt auch untere und obere Ausreißer, die dem Analysten einen Hinweis geben, welche Filialen besonders gut oder schlecht abschneiden.
Um die Daten genauer untersuchen zu können, erstellt der Analyst einzelne Boxplots für jede Region, in der sich die Filialen befinden. Dafür muss das Feld Gruppieren nach auf Region eingestellt werden. Es entstehen vier einzelne Boxplots, die verglichen werden können, um die Informationen zu jeder Region zu untersuchen.
Anhand der Boxplots kann der Analyst sehen, dass es zwischen den Regionen nur geringe Unterschiede gibt: Die Medianwerte sind in allen vier Boxplots gleich, die Boxen weisen ähnliche Größen auf, und alle Regionen haben Ausreißer im Minimum- und Maximumbereich. Die Whiskers für die Nord- und Zentral-Region sind jedoch etwas kürzer als die der Bay Area und Süd-Region, was darauf hinweist, dass diese Regionen eine einheitlichere Performance aufweisen. In der Bay Area und der Süd-Region sind die Whiskers etwas länger, was darauf hinweist, dass diese Regionen sowohl Filialen mit einer schlechten Performance als auch Filialen mit einer guten Performance aufweisen. Es bietet sich an, die Analysen auf diese beiden Regionen zu konzentrieren, um die Performance-Variationen zu untersuchen.
Erstellen eines Boxplot
Führen Sie zum Erstellen eines Boxplot die folgenden Schritte aus:
- Wählen Sie eine der folgenden Datenoptionen:
- Ein Zahlen- oder Anteil/Verhältnis-Feld .
- Ein Zahlen- oder Anteil/Verhältnis-Feld plus ein Zeichenfolgenfeld .
Hinweis:
Mit der Suchleiste im Datenbereich können Sie Felder suchen.
- Erstellen Sie den Boxplot mit folgenden Schritten:
- Ziehen Sie die ausgewählten Felder in eine neue Kachel.
- Ziehen Sie die Maus auf die Dropzone Diagramm.
- Legen Sie die ausgewählten Felder im Boxplot ab.
Tipp:
Sie können Diagramme auch über das Menü Diagramm über dem Datenbereich oder die Schaltfläche Visualisierungstyp auf einer vorhandenen Karte erstellen. Im Menü Diagramm sind nur die mit der Datenauswahl kompatiblen Diagramme aktiviert. Für das Menü Visualisierungstyp werden nur kompatible Visualisierungen (einschließlich Karten, Diagramme oder Tabellen) angezeigt.
Hinweis:
Aus Datenbank-Datasets erstellte Boxplots müssen mindestens fünf Datensätze aufweisen. Boxplots mit weniger als fünf Datensätzen können sich ergeben, wenn der Boxplot mit einem Zeichenfolgenfeld gruppiert oder ein Filter auf das Dataset bzw. die Kachel angewendet wird. Datenbank-Datasets sind über Datenbankverbindungen in Insights in ArcGIS Enterprise und Insights desktop verfügbar.
Verwendungshinweise
Mit der Schaltfläche Layer-Optionen wird der Bereich Layer-Optionen geöffnet. Der Bereich Layer-Optionen enthält die folgenden Funktionen:
- Die Registerkarte Legende ist verfügbar, wenn ein "Gruppieren nach"-Feld auf die X-Achse des Diagramms angewendet wird. Bei Verwendung eines "Gruppieren nach"-Feldes werden Boxplots nebeneinander erstellt, wobei jeder Boxplot die Verteilung der Daten in der einzelnen Kategorie darstellt. Mit der Schaltfläche "Pop-out-Legende" wird die Legende als separate Kachel auf der Seite angezeigt. Sie können die Legende verwenden, um Elemente in dem Diagramm auszuwählen. Zum Ändern der Farbe für einen Wert klicken Sie auf das Symbol, und wählen Sie eine Farbe aus der Palette aus, oder geben Sie einen Hexadezimalwert ein.
- Auf der Registerkarte Aussehen kann die Symbolfarbe im Diagramm geändert werden (nur Einzelsymbol).
Mithilfe der Schaltfläche Visualisierungstyp können Sie direkt zwischen einem Boxplot und anderen Visualisierungen, beispielsweise einer Karte mit abgestuften Symbolen, einer Summentabelle oder einem Histogramm, umschalten. Wenn der Boxplot ein Gruppieren nach-Feld enthält, kann als Visualisierung ein Diagramm, wie ein Linien- oder Säulendiagramm, verwendet werden.
Verwenden Sie die Schaltfläche Kachel umdrehen , um die Rückseite der Kachel anzuzeigen. Die Registerkarte Kachel-Info bietet Informationen über die Daten auf der Kachel, und auf der Registerkarte Daten exportieren können Benutzer die Daten von der Kachel exportieren.
Ein zentraler Aspekt für einen Boxplot ist die Ermittlung von Ausreißern. Ausreißer sind Werte, die viel größer oder kleiner sind als die restlichen Daten. Whiskers in einem Boxplot stellen den Schwellenwert dar, über den hinaus Werte als Ausreißer betrachtet werden. Wenn keine Ausreißer vorhanden sind, werden die Whiskers auf die Minimal- und Maximalwerte im Dataset gestreckt. In Insights wird der Bereich für die unteren und oberen Ausreißerwerte im Boxplot als Kreise angegeben, die mit gestrichelten Linien verknüpft sind.
Jede Statistik bzw. jeder Bereich im Boxplot kann durch einen Klick auf das Diagramm ausgewählt werden.
Beim Erstellen eines Boxplot wird dem Datenbereich ein Ergebnis-Dataset mit den Eingabefeldern und Ausgabestatistiken hinzugefügt. Das Ergebnis-Dataset kann zum Finden von Antworten mithilfe von nichträumlichen Analysen über die Schaltfläche Aktion verwendet werden.
Wie Boxplots funktionieren
Ein Boxplot besteht aus folgenden Komponenten:
Beschriftung | Komponente | Beschreibung |
---|---|---|
Whisker | Der Datenbereich, der kleiner als das erste Quartil und größer als das dritte Quartil ist. Jeder Whisker enthält 25 Prozent der Daten. Whiskers können in der Regel nicht größer als der 1,5-fache IQR sein, wodurch der Schwellenwert für die Ausreißer festgelegt wird. | |
Box | Der Datenbereich zwischen dem ersten Quartil und dem dritten Quartil. In diesen Bereich fallen 50 Prozent der Daten. Der Bereich zwischen dem ersten und dritten Quartil wird auch als Interquartilsabstand (Inter Quartile Range, IQR) bezeichnet. | |
Maximum | Der größte Wert im Dataset oder der größte Wert, der sich nicht jenseits des durch die Whiskers festgelegten Schwellenwertes befindet. | |
Drittes Quartil | Der Wert, bei dem 75 Prozent der Daten kleiner und 25 Prozent der Daten größer sind. | |
Medianwert | Die mittlere Zahl im Dataset. Eine Hälfte der Zahlen ist größer als der Medianwert und die andere Hälfte ist kleiner. Der Median kann auch als zweites Quartil bezeichnet werden. | |
Erstes Quartil | Der Wert, bei dem 25 Prozent der Daten kleiner und 75 Prozent der Daten größer sind. | |
Minimum | Der kleinste Wert im Dataset oder der kleinste Wert, der sich nicht jenseits des durch die Whiskers festgelegten Schwellenwertes befindet. | |
Ausreißer | Datenwerte, die größer oder kleiner als die durch die Whiskers festgelegten Schwellenwerte sind. |