Der Workflow "Benchmark-Vergleiche" vergleicht Standorte anhand von Kriterien und Benchmark-Werten, die Sie definieren. Wählen Sie zunächst die Standorte aus, die in die Analyse einbezogen werden sollen, und legen Sie dann die Variablen und einen Benchmark fest. Der Workflow vergleicht Ihre Standorte, die als farbcodierte Symbole auf der Karte angezeigt werden, und passt die Analyse an, wenn Sie die Vergleichsmethode oder den Benchmark-Wert ändern. Die Ergebnisse dieser Analyse werden im Bereich Ergebnisse angezeigt und können als neuer Layer in Ihrem Projekt gespeichert oder in ein Excel-Arbeitsblatt exportiert werden.
Beispiel
Eine Business-to-Consumer-Agentur untersucht Standorte in Pittsburgh, Pennsylvania, für eine Fernsehwerbekampagne. Sie verwenden den Workflow "Benchmark-Vergleiche", um Postleitzahlen im DMA (Designated Market Area) in Pittsburgh mit der Variablenliste Bevölkerung und Einkommen und dem Medianwert als Benchmark-Wert zu vergleichen. Die Karte verwendet eine Farbcodierung mit der Vergleichsmethode Über und unter Benchmark, um darzustellen, ob eine Postleitzahl über oder unter dem Medianwert liegt.
Anhand dieser Analyse kann die Agentur bestimmen, wo sie ihre Werbekampagne auf der Grundlage des Vergleichs der Standorte mit dem Benchmark-Wert ausrichten sollte. So stehen Postleitzahlen über dem Medianwert für einkommensstärkere oder bevölkerungsreichere Gebiete, die sich ideal für Luxuswerbung eignen, während Postleitzahlen unter dem Medianwert auf preisgünstige Produkte abzielen können. Wenn die Agentur eine zusätzliche Analyse durchführen müsste, könnte sie die Standardabweichung verwenden, um zu bewerten, ob es eine Einkommensschere gibt, die die Werbung für verschiedene Arten von Produkten oder Services innerhalb desselben Gebiets nahelegen könnte.
Ergebnisse
Sie können die Ergebnisse der Analyse als Karten-Layer und im Bereich Ergebnisse anzeigen. Dieser umfasst folgende Felder Zusammenfassung , Histogramm , Blasendiagramm und Tabelle . Weitere Informationen über den Bereich Ergebnisse der Benchmark-Vergleiche finden Sie unter Referenz für den Bereich "Ergebnisse". Jeder Standort auf der Karte ist farbcodiert, um die Benchmark-Vergleiche darzustellen.
Berechnungen
Benchmark-Vergleiche nutzen die Verteilung von Daten, um die Performance im Vergleich zu einem Benchmark zu vergleichen. Bei dieser Analyse werden Kennzahlen der zentralen Tendenz, der Datenstreuung und der Form der Datenverteilung verwendet. Anhand dieser Erkenntnisse können die Benutzer erkennen, ob die Daten konzentriert oder weit gestreut sind oder ob es Extremwerte gibt.
Kennzahlen der zentralen Tendenz
Kennzahlen der zentralen Tendenz werden verwendet, um die Tendenzen der Daten zusammenzufassen. Im Workflow "Benchmark-Vergleiche" stehen die Mittel- und Medianwerte für das Benchmarking zur Verfügung.
Mittelwert
Der Mittelwert oder Durchschnitt wird berechnet, indem alle Werte addiert und diese Summe durch die Anzahl der Werte dividiert wird. Das Ergebnis gibt einen Zentralpunkt der Daten an. Bei Benchmark-Vergleichen kann der Mittelwert der Daten mit dem Benchmark verglichen werden, um festzustellen, ob die Daten im Durchschnitt eher höher oder niedriger als der Benchmark sind.
Medianwert
Der Medianwert ist der Mittelwert, wenn die Daten vom niedrigsten zum höchsten Wert geordnet sind. Bei einem schiefen Dataset kann der Medianwert einen besseren Hinweis auf die zentrale Tendenz geben als der Mittelwert, da er weniger von Extremwerten oder Ausreißern beeinflusst wird, die den Mittelwert verzerren können. Bei Benchmark-Vergleichen wird häufig der Medianwert verwendet, um den typischen Wert zu verstehen, insbesondere wenn es sich um schiefe Daten handelt.
Datenstreuung
Die Streuung der Daten kann entweder anhand des Interquartil-Bereichs (Interquartile Range, IQR) oder der Standardabweichung (Standard Deviation, SD) gemessen werden. Der IQR eignet sich besser für die Analyse von schiefen Daten oder Daten außerhalb des normalen Bereichs, während die Standardabweichung eher für die Analyse von normal verteilten Daten geeignet ist. Durch die Analyse der Datenstreuung können ungewöhnliche Werte oder Ausreißer ermittelt werden. Ausreißer sind Datenpunkte oder Werte, die außerhalb des normalen Bereichs liegen und nicht dem Muster der restlichen Daten entsprechen. Insbesondere werden Ausreißer in der Regel als Werte definiert, die mehr als das 1,5-fache des IQR über Q3 oder unter Q1 oder 3 Standardabweichungen vom Mittelwert einer Normalverteilung liegen.
Die Minimal- und Maximalwerte definieren den Bereich, in den alle Daten fallen. Bei Benchmark-Vergleichen helfen die Minimal- und Maximalwerte dabei, den Bereich oder die Streuung der Daten zu ermitteln, d. h. wie weit die Datenwerte im Vergleich zu den Referenzdaten, die als Benchmark für den Vergleich herangezogen werden, verteilt sind. Der Minimalwert ist der kleinste Wert in den Daten. Der Maximalwert ist der größte Wert in den Daten.
Interquartil-Bereich (IQR)
Der Interquartil-Bereich (IQR) misst die Streuung der mittleren 50 Prozent der Daten. Dies ist der Bereich zwischen dem ersten Quartil (Q1) und dem dritten Quartil (Q3).
- Q1 (1. Quartil): Das 25. Perzentil, d. h. der Punkt, unter dem 25 % der Daten liegen.
- Q2 (2. Quartil/Medianwert): Das 50. Perzentil bzw. der Medianwert der Daten.
- Q3 (3. Quartil): Das 75. Perzentil, d. h. der Punkt, unter dem 75 % der Daten liegen.
Der IQR ist nützlich, um die zentrale Streuung von Daten zu ermitteln, und wird häufig in Boxplots dargestellt. Durch die Konzentration auf den Bereich, in den die mittleren 50 Prozent der Daten fallen, bietet der IQR einen Einblick in die Variabilität der Daten um den Medianwert herum, wobei Extremwerte oder Ausreißer ausgeschlossen werden.
Standardabweichung
Die Standardabweichung misst, wie stark die Variation oder Streuung eines Dataset ist. Bei einer Normalverteilung liegen etwa 68,1 % der Datenpunkte innerhalb von ±1 Standardabweichung vom Mittelwert, etwa 95,4 % innerhalb von ±2 Standardabweichungen und etwa 99,7 % innerhalb von ±3 Standardabweichungen. Eine geringe Standardabweichung bedeutet, dass die meisten Datenpunkte nahe am Mittelwert liegen, während eine hohe Standardabweichung auf eine breite Streuung der Daten hinweist. Die Auswertung der Standardabweichung hilft zu beurteilen, wie weit die Daten im Vergleich zum Benchmark gestreut sind.
Form der Datenverteilung
Die Form der Datenverteilung kann mit Hilfe von Schiefe und Kurtosis gemessen werden. Die Schiefe misst die Asymmetrie der Datenverteilung. Es hilft zu klären, ob die Daten im Vergleich zum Benchmark eher zu höheren oder niedrigeren Werten tendieren. Die Kurtosis beschreibt das Gewicht der Spitzen und Flanken einer Verteilung im Vergleich zur Normalverteilung. Sie zeigt das Vorhandensein von Ausreißern im Vergleich zu einer Normalverteilung an.
Schiefe
Die Schiefe kann mithilfe der Pearson-Modus-Schiefe wie folgt berechnet werden:
Diese Formel misst, wie asymmetrisch ein Dataset ist, indem sie den Mittelwert und den Medianwert vergleicht. Die 3 ist eine empirische Konstante, die die typische Beziehung in schiefen Verteilungen ausgleicht, bei der die Differenz zwischen Mittelwert und Medianwert bei schiefen Daten etwa dreimal so groß ist. Dies hilft, zu quantifizieren, wie stark die Daten von der Symmetrie abweichen, und zeigt an, ob die Daten im Vergleich zum Mittelwert mehr niedrige und hohe Extremwerte aufweisen.
Nach der Berechnung gibt es drei Schiefe-Typen.
Schiefe-Typ | Bild | Beschreibung | Berechnung |
---|---|---|---|
Symmetrische Verteilung | Keine Schiefe, die Daten sind gleichmäßig um den Mittelwert verteilt. |
| |
Positive Schiefe (Schiefe rechts) | Es liegen mehr Werte unter dem Mittelwert, sodass sich ein langer Ausläufer auf der rechten Seite ergibt. |
| |
Negative Schiefe (Schiefe links) | Es liegen mehr Werte über dem Mittelwert, sodass sich ein langer Ausläufer auf der linken Seite ergibt. |
|
Kurtosis
Die Kurtosis wird nach der folgenden Formel berechnet:
In dieser Formel steht n für die Anzahl der Beobachtungen, μ für den Mittelwert der Grundgesamtheit und σ für die Standardabweichung der Grundgesamtheit. Eine positive Kurtosis weist auf eine Verteilung hin, die spitzer als normal ist, während ein negativer Wert auf eine flachere Verteilung hinweist. Eine Normalverteilung hat eine Kurtosis von 0.
Nach der Berechnung gibt es drei Kurtosis-Typen.
Kurtosis-Typ | Bild | Beschreibung | Berechnung |
---|---|---|---|
Mesokurtisch | Ähnlich einer Normalverteilung, weist auf eine mäßige Anzahl von Ausreißern hin |
| |
Leptokurtisch | Spitze Verteilung mit schwereren Ausläufern (heavy tails), weist auf eine höhere Anzahl von Ausreißern hin |
| |
Platykurtisch | Flachere Verteilung mit leichteren Ausläufern (light tails), weist auf eine geringere Anzahl von Ausreißern hin |
|
Einschränkungen
Sie können maximal 5.000 bestehende Standorte auswählen. Alternativ können Sie bis zu 1.000 Features auf der Karte auswählen – zum Beispiel Features, die der Karte über die Suche nach Points of Interest oder durch den Import einer Datei hinzugefügt werden.
Credits
Bei diesem Workflow werden Credits verbraucht. Für das Exportieren der Ergebnisse in Excel werden schätzungsweise 10 Credits für je 1.000 Datensätze verbraucht.
Umfassende Informationen zum Verbrauch von Credits in Business Analyst Web App finden Sie unter Credits.
Ressourcen
Weitere Informationen zu Benchmark-Vergleichen finden Sie unter Durchführen von Benchmark-Vergleichen.