Erstellen und Verwenden eines Histogramms

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Histogramme aggregieren numerische Daten in gleiche Intervallgruppen, sogenannte Abschnitte, und zeigen die Häufigkeit von Werten in den einzelnen Abschnitten an. Ein Histogramm wird mit einem einzelnen Zahlen- oder Anteil/Verhältnis-Feld erstellt.

Histogramme können beispielsweise Antworten auf folgende Fragen zu Ihren Daten liefern: Wie sieht die Verteilung numerischer Werte aus und wie häufig kommen sie in einem Dataset vor? Gibt es Ausreißer?

Beispiel

Eine gemeinnützige Gesundheitsorganisation untersucht die Übergewichtigkeit von Jugendlichen in den Vereinigten Staaten. Mit einem Histogramm der Adipositasraten unter Jugendlichen in den einzelnen Staaten kann die Verteilung der Adipositasraten ermittelt werden, z. B. die größte und kleinste Häufigkeit sowie der Gesamtbereich.

Histogramm der Verteilung der Adipositasrate unter Jugendlichen in den USA

Das Histogramm oben zeigt eine Normalverteilung und deutet darauf hin, dass die Raten der am häufigsten vorkommenden Fälle im Bereich zwischen 10 und 14 Prozent liegen.

Eine Erhöhung oder Verringerung der Anzahl der Abschnitte kann Einfluss auf die Analyse der Daten haben. Die Daten bleiben zwar unverändert, jedoch kann sich ihr Aussehen ändern. Es ist wichtig, eine geeignete Anzahl an Abschnitten für Ihre Daten auszuwählen, sodass Muster in den Daten nicht fehlinterpretiert werden. Zu wenige Abschnitte machen wichtige Muster möglicherweise nicht sichtbar, und zu viele Abschnitte können kleine, jedoch zu erwartende Schwankungen in den Daten wichtig erscheinen lassen. Die folgenden Abbildung enthält ein Beispiel für eine angemessene Anzahl an Abschnitten für die Daten. Jeder Abschnitt enthält einen Bereich von ungefähr einem Prozent, und die Daten können mit einem feineren Maßstab untersucht werden, um Muster zu erkennen, die bei der Verwendung von sechs Abschnitten nicht zu sehen wären. In diesem Fall handelt es sich beim hervortretenden Muster um eine Normalverteilung um den Mittelwert mit einer leichten, jedoch nicht signifikanten Verzerrung nach links.

Histogramm mit 12 Abschnitten und neuen Mustern

Erstellen eines Histogramms

Führen Sie zum Erstellen eines Histogramms die folgenden Schritte aus:

  1. Wählen Sie ein Zahlen- Zahlenfeld oder Anteil/Verhältnis-Feld Anteil-/Verhältnisfeld aus.
    Tipp:

    Mit der Suchleiste im Datenbereich können Sie Felder suchen.

  2. Erstellen Sie das Histogramm mit folgenden Schritten:
    1. Ziehen Sie die ausgewählten Felder in eine neue Kachel.
    2. Ziehen Sie die Maus auf die Dropzone Diagramm.
    3. Legen Sie die ausgewählten Felder im Histogramm ab.
Tipp:

Sie können Diagramme auch über das Menü Diagramm über dem Datenbereich oder die Schaltfläche Visualisierungstyp Visualisierungstyp auf einer vorhandenen Karte erstellen. Im Menü Diagramm sind nur die mit der Datenauswahl kompatiblen Diagramme aktiviert. Für das Menü Visualisierungstyp werden nur kompatible Visualisierungen (einschließlich Karten, Diagramme oder Tabellen) angezeigt.

Histogramme können auch mithilfe von Histogramm anzeigen erstellt werden, das über die Schaltfläche Aktion Aktion unter Antworten suchen > Wie verteilt sich etwas? aufgerufen werden kann.

Verwendungshinweise

Histogramme werden durch Einzelwerte symbolisiert. Sie können mit der Schaltfläche Layer-Optionen Legende die Symbolfarbe und die Umrissfarbe ändern, die auf alle Abschnitte angewendet werden.

Wenn ein Histogramm erstellt wird, berechnet Insights automatisch eine entsprechende Anzahl von Abschnitten zum Anzeigen Ihrer Daten. Sie können die Anzahl der Abschnitte ändern, indem Sie den Schieberegler entlang der X-Achse verwenden oder auf die Anzahl der Abschnitte klicken und eine neue Zahl eingeben.

Hinweis:

Wenn sich die gewählte Anzahl von Abschnitten nicht gleichmäßig im Datenbereich verteilen lässt, werden die Abschnitte mithilfe von Dezimalwerten berechnet. In Histogrammen werden anstelle von Dezimalzahlen gerundete ganze Zahlen als Abschnittsbeschriftungen angezeigt. Die gerundeten ganzen Zahlen dienen nur der Anzeige, die Dezimalwerte werden für alle Berechnungen verwendet. Wenn ein Abschnitt Datenwerte nahe der oberen oder unteren Grenze enthält und die Beschriftung gerundet ist, erscheinen die Anfangs- und Endwerte des Abschnitts möglicherweise fehlerhaft, da mit den Beschriftungen anstelle von Dezimalwerten gerundete Werte angezeigt werden.

Verwenden Sie die Schaltfläche Diagrammstatistiken Diagrammstatistiken, um den Durchschnitt, den Median und die Normalverteilung der Daten anzuzeigen. Eine Normalverteilungskurve stellt die erwartete Verteilung einer auf dem Zufallsprinzip basierenden Stichprobe kontinuierlicher Daten dar, wobei die höchste Häufigkeit der Werte um den Mittelwert zentriert ist und die Häufigkeit der Werte mit zunehmender oder abnehmender Entfernung vom Mittelwert abnimmt. Eine Normalverteilungskurve ist hilfreich, wenn Sie ermitteln möchten, ob Ihre Daten eine Verzerrung (die Daten enthalten beispielsweise häufiger niedrige Werte) oder Ausreißer aufweisen.

Mithilfe der Schaltfläche Visualisierungstyp Visualisierungstyp können Sie direkt zwischen einem Histogramm und einer Karte mit abgestuften Symbolen oder einer Summentabelle umschalten.

Verwenden Sie die Schaltfläche Kachel umdrehen Kachel umdrehen, um die Rückseite der Kachel anzuzeigen. Die Registerkarte Kachel-Info Kachel-Info bietet Informationen über die Daten auf der Kachel, und auf der Registerkarte Daten exportieren Daten exportieren können Benutzer die Daten von der Kachel exportieren.

Der Hintergrund eines Histogramms zeigt die folgenden Werte an: Mittelwert, Medianwert, Standardabweichung, Schiefe und Kurtosis (vereinfacht). Schiefe und Kurtosis werden in der folgenden Tabelle beschrieben:

StatistikBeschreibung

Schiefe

Anhand der Schiefe wird ermittelt, ob die Verteilung der Daten symmetrisch ist. Anhand der Schiefemessung wird ermittelt, ob die meisten Verteilungswerte links oder rechts des Mittelwertes liegen. Die Schiefe der Normalverteilung ist Null, wobei auf beiden Seiten des Mittelwertes die gleiche Datenmenge angezeigt wird.

Schiefewerte können Null, negativ oder positiv sein:

  • Null: Die Daten haben eine symmetrische Verteilung.
  • Negativ: Die Daten sind asymmetrisch und nach rechts verzerrt. Die größte Häufigkeit von Werten kann rechts neben dem Mittelwert festgestellt werden. Der linke Ausläufer ist dabei länger als der rechte. Der Medianwert ist größer als der Mittelwert.
  • Negativ: Die Daten sind asymmetrisch und nach links verzerrt. Die größte Häufigkeit von Werten kann links neben dem Mittelpunkt festgestellt werden. Der rechte Ausläufer ist dabei länger als der linke. Der Mittelwert ist größer als der Medianwert.

Kurtosis

Anhand der Kurtosis wird die Form der Häufigkeitsverteilung beschrieben. Sie gibt zudem an, mit welcher Wahrscheinlichkeit Ausreißer in der Verteilung vorliegen. Verteilungen mit relativ starken Ausläufern werden als leptokurtisch bezeichnet und weisen eine Kurtosis von größer als Null auf. Verteilungen mit relativ leichten Ausläufern werden als platykurtisch bezeichnet und weisen eine Kurtosis von kleiner Null auf. Die Kurtosis einer Normalverteilung ergibt den Wert Drei bzw. bei Verwendung der vereinfachten Kurtosis den Wert Null (diese wird mit derselben Formel wie Kurtosis ermittelt, jedoch minus 3).

Die vereinfachte Kurtosis kann die Werte Null, negativ oder positiv aufweisen:

  • Null: Der Modus ist mit dem des Mittelwertes identisch.
  • Negativ: Die Datenverteilung weist kürzere Ausläufer auf, und der Spitzenwert ist flacher.
  • Positiv: Die Ausläufer der Kurve sind länger und der Spitzenwert ist höher.