Histogramm

Histogramme fassen die Verteilung einer kontinuierlichen numerischen Variable durch die Messung der Häufigkeit zusammen, mit der bestimmte Werte im Dataset vorhanden sind. Die X-Achse in einem Histogramm ist eine Zahlenlinie, die in zwei Zahlenbereiche oder Abschnitte unterteilt ist. Für jeden Abschnitt wird ein Balken dargestellt, wobei die Breite des Balkens den Bereich des Abschnitts und die Höhe des Balkens die Anzahl der Punkte darstellt, die in diesen Bereich fallen. Das Verständnis der Datenverteilung ist ein wichtiger Schritt bei der Untersuchung von Daten.

Variable

Für Histogramme ist eine kontinuierliche Zahlenvariable auf der X-Achse erforderlich.

Mehrere Reihen

Im folgenden Video wird gezeigt, wie anhand des Feldes Unterteilen nach Histogramme mit mehreren Reihen erstellt werden:

Play Video

  • Videolänge: 0:57
  • Dieses Video wurde mit ArcGIS Pro 3.2 erstellt.

Histogramme mit mehreren Reihen können erstellt werden, indem Sie das Steuerelement Unterteilen nach festlegen. Wenn das Steuerelement Unterteilen nach festgelegt ist, wird das Histogramm basierend auf der Anzahl der eindeutigen Kategorien im Feld in mehrere Reihen unterteilt. Wenn Sie beispielsweise ein Histogramm für ein Dataset im Zusammenhang mit Immobilienpreisen anzeigen, ist das Steuerelement Zahl auf SoldPrice festgelegt, um die Verteilung der Immobilienpreise in einer Stadt anzuzeigen. Durch Festlegen des Steuerelements Unterteilen nach auf Neighborhood wird das Histogramm in n Reihen unterteilt, wobei n die Anzahl der eindeutigen Nachbarschaftswerte ist. Das Histogramm mit mehreren Reihen zeigt n Mini-Diagramme an (eins für jeden Neighborhood-Einzelwert), sodass die Verteilung der Immobilienpreise mit allen Unterteilen nach-Werten verglichen werden kann.

Hinweis:

Kategoriefelder mit vielen eindeutigen Werten sind nicht zum Teilen eines Feldes in mehrere Reihen geeignet.

Histogramme mit mehreren Reihen können nur mit einem Gitter-Layout angezeigt werden, das auf der Registerkarte Reihe im Bereich Diagrammeigenschaften angepasst werden kann. Sie können die Layout-Bemaßungen eines Rasterdiagramms anpassen, indem Sie den Wert Mini-Diagramme pro Zeile festlegen. Lautet die Eingabe für Mini-Diagramme pro Zeile beispielsweise 3, werden maximal drei Diagramme pro Zeile angezeigt. Die Gesamtzahl der Zeilen im Raster wird durch die Anzahl der Reihen im Diagramm bestimmt. Aktivieren Sie das Kontrollkästchen Diagrammvorschau anzeigen, um jedes Mini-Diagramm dynamisch zu erkunden. Wählen Sie hierzu ein Mini-Diagramm aus, und zeigen Sie es in einem größeren Vorschaudiagramm an.

Histogramme mit mehreren Reihen

Transformation

Einige analytische Methoden erfordern, dass die Daten normal verteilt sind. Wenn die Daten verzerrt sind (die Verteilung ist einseitig schief), sollten Sie die Daten transformieren, um eine Normalverteilung herzustellen. Mit Histogrammen können Sie die Effekte von logarithmischen und Quadratwurzel-Transformationen auf die Datenverteilung erkunden. Als Referenz können Sie einem Histogramm eine Normalverteilungs-Überlagerung hinzufügen, indem Sie das Kontrollkästchen Normalverteilung anzeigen im Bereich Diagrammeigenschaften aktivieren.

Logarithmische Transformation

Die logarithmische Transformation wird häufig dann verwendet, wenn die Daten eine positiv verzerrte Verteilung haben und nur wenige große Werte vorhanden sind. Wenn diese großen Werte im Dataset vorhanden sind, hilft die logarithmische Transformation, konstantere Varianzen zu erreichen und die Daten zu normalisieren.

Im folgenden Beispiel wurde die positiv verzerrte Verteilung im ersten Diagramm mit einer logarithmischen Transformation in eine Normalverteilung transformiert, was im zweiten Diagramm dargestellt ist:

Zwei Bevölkerungsdiagramme

Hinweis:

Logarithmische Transformationen können nur auf Zahlen größer als Null angewendet werden.

Quadratwurzel-Transformation

Eine Quadratwurzel-Transformation ähnelt einer logarithmischen Transformation dadurch, dass sie die rechtsseitige Schiefe eines Datasets verringert. Im Gegensatz zur logarithmischen Transformation kann die Quadratwurzel-Transformation auch auf die Null angewendet werden.

Hinweis:

Quadratwurzel-Transformationen können nur auf Zahlen größer als oder gleich Null angewendet werden.

Kehrwerttransformation

Bei einer Kehrwerttransformation wird der reziproke Wert (1/x) der einzelnen Werte (x) in dem Feld verwendet.

Hinweis:

Kehrwerttransformationen können nicht auf Null-Werte angewendet werden. Null-Werte in dem Feld werden als NULL-Werte ausgewertet.

Box-Cox-Transformation

Bei einer Box-Cox-Transformation wird die folgende Potenzfunktion auf normal verteilte Werte angewendet:

Box-Cox-Transformation

Dabei gilt: x' ist der transformierte Wert, x ist der ursprüngliche Wert, λ1 ist der Wert für den Parameter Potenz und λ2 ist der Wert für den Parameter Versatz.

Hinweis:

Box-Cox-Transformationen können nur auf positive Werte angewendet werden. Wenn negative oder Null-Werte vorhanden sind, verwenden Sie den Parameter Versatz, um sicherzustellen, dass alle Werte positiv sind.

Anzahl an Abschnitten

Der Standardwert für "Anzahl der Abschnitte" entspricht der Quadratwurzel der Anzahl von Datensätzen im Dataset. Sie können dies durch Änderung des Wertes für Abschnitte auf der Registerkarte Daten des Bereichs Diagrammeigenschaften anpassen. Wenn Sie die Anzahl der Abschnitte ändern, können Sie mehr oder weniger Details in der Datenstruktur anzeigen.

Hinweis:

Histogramme sind auf maximal 64 Abschnitte begrenzt. Dieser Grenzwert wird vorgegeben, da die Verwendung zu vieler Abschnitte häufig zu einem verrauschten Histogramm führt, sodass die Eigenschaften der Verteilung schwer zu deuten sind.

Statistiken

Verschiedene deskriptive Abschnitte werden berechnet und als vertikale Linien in Histogrammen angezeigt. Der Mittel- und Medianwert werden jeweils mit einer Linie und eine Standardabweichung über und unter dem Mittelwert wird anhand von zwei Linien dargestellt. Sie können in der Diagrammlegende auf diese Elemente klicken, um sie zu aktivieren oder zu deaktivieren.

Auf der Registerkarte Daten des Bereichs Diagrammeigenschaften wird die Tabelle "Statistiken" angezeigt. Diese enthält die folgenden Statistiken für das ausgewählte numerische Feld:

  • Mittelwert
  • Medianwert
  • Standardabweichung
  • Anzahl
  • Min
  • Max
  • Summe
  • NULL-Werte
  • Schiefe
  • Kurtosis

Wenn der Quell-Layer des Diagramms über einen Auswahlsatz verfügt, enthält die Tabelle "Statistiken" eine Spalte, in der Statistiken für das vollständige Dataset angezeigt werden, und eine Spalte, in der nur Statistiken für den Auswahlsatz angezeigt werden.

Die Tabelle "Statistiken" enthält zudem Steuerelemente, mit denen Sie die Linien für Mittelwert, Medianwert und Standardabweichung des Histogramms aktivieren und deaktivieren sowie ihre Farbe ändern können.

Klicken Sie mit der rechten Maustaste in die Tabelle "Statistiken", und wählen Sie Tabelle kopieren, Zeile kopieren oder Wert kopieren aus, um Statistiken aus dem Bereich Diagrammeigenschaften in andere Fenster oder Anwendungen zu kopieren.

Achsen

Mehrere Optionen steuern die Achsen und die zugehörigen Einstellungen.

Grenzen der Y-Achse

Die Standardgrenzen der Y-Achse werden entsprechend dem Bereich der Datenwerte auf der Achse festgelegt. Sie können diese Werte anpassen, indem Sie einen neuen Wert für die Achsengrenze angeben. Sie können Achsengrenzen festlegen, um einen konsistenten Diagrammmaßstab für Vergleiche zu verwenden. Klicken Sie auf die Schaltfläche "Zurücksetzen", um die Grenze der Achse auf den Standardwert zurückzusetzen.

Gitternetzintervalle

Gitternetzintervalle für die Y-Achse werden mit dem Steuerelement Intervall konfiguriert. Das Standardgitternetzintervall wird automatisch berechnet.

Zahlenformat

Sie können formatieren, wie numerische Werte auf einer Achse dargestellt werden, indem Sie eine Zahlenformatkategorie angeben oder eine benutzerdefinierte Formatzeichenfolge definieren. Beispiel: $#,### kann als benutzerdefinierte Formatzeichenfolge für die Darstellung von Werten in einer Währung verwendet werden.

Aussehen

Titel und Beschreibung

Diagramme und Achsen erhalten Standardtitel basierend auf den Variablennamen und dem Diagrammtyp. Diese können auf der Registerkarte Allgemein im Bereich Diagrammeigenschaften bearbeitet werden. Sie können auch eine Beschreibung für das Diagramm eingeben, wobei es sich um einen Textblock handelt, der am unteren Rand des Diagrammfensters angezeigt wird.

Farbe

Mit dem Farbfeld neben Abschnitte auf der Registerkarte Daten des Bereichs Diagrammeigenschaften können Sie die Farbe der Abschnitte eines Histogramms ändern.

Führungslinien

Führungslinien oder Bereiche können als Referenz oder zum Hervorheben signifikanter Werte zu Diagrammen hinzugefügt werden. Um eine neue Führungslinie zur Registerkarte Führungslinien im Bereich Diagrammeigenschaften hinzuzufügen, klicken Sie auf Führungslinie hinzufügen. Um eine Linie zu zeichnen, geben Sie einen Wert ein, wo die Linie gezeichnet werden soll. Um einen Bereich zu erstellen, geben Sie einen Wert bis ein. Sie können optional Text zur Führungslinie hinzufügen, indem Sie Beschriftung angeben.

Beispiel

Im folgenden Histogramm wird die Verteilung der Bevölkerungsdichte von Blockgruppen in Washington, D.C. visualisiert.

  • Zahl:Population Density

Histogramm der Bevölkerungsdichte