Referenz zur Variablenkorrelation

In der Eignungsanalyse können Sie mit dem Werkzeug "Korrelationsmatrix" bewerten, wie Ihre Variablen miteinander und mit dem Endergebnis korrelieren. Diese Analyse identifiziert Multikollinearität (überlappende oder redundante Variablen). Dies ermöglicht eine bessere Auswahl der Variablen, fundiertere Entscheidungen hinsichtlich der Gewichtung und eine Verbesserung des Eignungsindexdesigns.

Eignungsanalysen umfassen häufig Variablen, die ähnliche Konzepte messen. Wenn Sie Überschneidungen nicht überprüfen, könnte ein Konzept doppelt gezählt werden und die Ergebnisse verfälschen.

Beispiel

Eine Regierungsbehörde nutzt Eignungsanalysen, um potenzielle Standorte für eine temporäre Lebensmittelausgabe zu ermitteln. In der Analyse haben sie sowohl die Armutsquote als auch die Arbeitslosenquote als Variablen berücksichtigt. Anhand der Korrelationsmatrix wird deutlich, dass eine hohe Korrelation zwischen der Armutsquote und der Arbeitslosenquote besteht. Ohne Anpassung könnte sich die wirtschaftliche Benachteiligung in der Analyse übermäßig widerspiegeln. Empfohlen wird, dass die Analysten die Entfernung einer Variablen aus dem redundanten Paar, die Zusammenführung verwandter Variablen in einem Teilindex oder die Anpassung ihrer Gewichtung in Betracht ziehen, damit das Konzept nicht doppelt gezählt wird.

Beispiel einer Korrelationsmatrix

Ergebnisse

Die Korrelationsmatrix analysiert die Ergebnisse einer Eignungsanalyse, um die Auswahl Ihrer Variablen zu validieren. So können Sie beispielsweise Multikollinearität und Einflüsse des Balance-Index erkennen. Mit diesem Wissen können Sie die Aussagekraft Ihrer Eignungsanalyse verbessern.

Führen Sie die folgenden Schritte aus, um Ihre Variablenauswahl mithilfe der Korrelationsmatrix zu validieren:

  • Ermitteln der Multikollinearität Multikollinearität liegt vor, wenn mindestens zwei Variablen so stark miteinander korreliert sind, dass sie dieselben Informationen erfassen, so dass es schwierig ist, die individuellen Auswirkungen der einzelnen Variablen zu erkennen. Überprüfen Sie Variablenpaare mit hoher Korrelation (z. B. r nach Pearson-Wert > 0,75). Zur Reduzierung der Multikollinearität können Sie folgende Lösungen in Betracht ziehen:
    • Entfernen einer Variablen aus einem stark korrelierten Paar
    • Zusammenführung korrelierter Variablen zu einem Teilindex (z. B. wirtschaftliche Vulnerabilität oder Zugang zu Gesundheitsversorgung)
    • Anpassung der Gewichtungen, um den Effekt stark korrelierter Variablen abzuschwächen, sodass dasselbe zugrunde liegende Konzept nicht doppelt gezählt wird
    Hinweis:

    Passen Sie Gewichtungen stets unter Berücksichtigung Ihrer Fachkenntnisse an.

  • Einfluss des Balance-Index Markieren Sie alle Variablen, die eine starke Korrelation mit dem Endergebnis aufweisen (z. B. r nach Pearson-Wert > 0,85). Passen Sie deren Gewichtung an oder gruppieren Sie sie mit verwandten Variablen in einem Teilindex, damit das Modell nicht von einem einzelnen Faktor dominiert wird. Ausführliche Anweisungen zum Erstellen von Teilindizes finden Sie unter Creating Composite Indices Using ArcGIS.

Berechnungen

Die Eignungsanalyse führt Berechnungen anhand ausgewählter Variablen durch; dabei werden häufig Variablen berücksichtigt, die konzeptionell oder statistisch ähnlich sind. Ohne auf Überschneidungen zu achten, könnten Sie unbeabsichtigt mehrere Variablen einbeziehen, die dasselbe zugrunde liegende Konzept repräsentieren, was zu verzerrten oder verfälschten Ergebnissen führen kann.

Korrelationskoeffizient

Der r nach Pearson-Wert ist ein Koeffizient, der zwischen -1 und 1 liegt und sowohl die Stärke als auch die Richtung einer linearen Beziehung misst. Beispiel: Werte näher an +1 weisen auf eine starke positive Beziehung hin, während Werte näher an -1 eine starke negative Beziehung anzeigen. Werte nahe 0 weisen auf eine geringe oder keine lineare Beziehung hin. In der Korrelationsmatrix können Sie die Visualisierung auf der Grundlage des r nach Pearson-Werts filtern.

Statistische Signifikanz

Die statistische Signifikanz gibt Auskunft darüber, wie wahrscheinlich es ist, dass eine Korrelation tatsächlich besteht und nicht nur zufällig ist. Niedrigere p-Werte (z. B. p < 0,01) weisen auf einen statistisch zuverlässigeren Zusammenhang hin. Dies bedeutet, dass die Korrelation weniger wahrscheinlich auf Zufall zurückzuführen ist. In den meisten Fällen wird ein p-Wert kleiner als 0,05 als statistisch signifikant angesehen. Ein p-Wert von 0,05 entspricht einem Konfidenzniveau von 95 Prozent und ist ein gängiger Schwellenwert für die Bestimmung der statistischen Signifikanz.

In der Korrelationsmatrix können Sie die Visualisierung auf der Grundlage der statistischen Signifikanz der Variablen filtern. Zu Darstellung der statistischen Signifikanz werden Sternchen wie folgt verwendet:

Sternchenp-WertStatistische Signifikanz

***

p < 0,001

Hochgradig signifikant

**

p < 0,01

Mäßig signifikant

*

p < 0,05

Signifikant

Keine

Keine

Nicht statistisch signifikant

Einschränkungen

Die Korrelationsmatrix ist nur im Eignungsanalyse-Workflow verfügbar.

Credits

Bei diesem Workflow werden Credits verbraucht. Für das Exportieren der Ergebnisse in Excel werden schätzungsweise 10 Credits für je 1.000 Datensätze verbraucht.

Umfassende Informationen zum Verbrauch von Credits in Business Analyst Web App finden Sie unter Credits.

Lizenzanforderungen

Der Workflow "Eignungsanalyse" ist für Benutzer mit einer Advanced-Lizenz für Business Analyst Web App verfügbar. Weitere Informationen zu Business Analyst-Lizenztypen finden Sie unter Lizenzen.

Ressourcen

Weitere Informationen zur Eignungsanalyse finden Sie in den folgenden Ressourcen: