Zusammengesetzten Index berechnen (Spatial Statistics)

Zusammenfassung

Kombiniert mehrere numerische Variablen, um einen einzelnen Index zu erstellen.

Zusammengesetzte Indizes werden im sozialen Bereich und im Umweltschutz verwendet, um komplexe Informationen mehrerer Indikatoren als einzelnen Kennwert darzustellen, der den Fortschritt in Richtung eines Ziels messen und Entscheidungen erleichtern kann. Dieses Werkzeug unterstützt die drei Hauptschritte des Indexerstellungsprozesses: Standardisieren der Eingabevariablen in einem einheitlichen Maßstab (Vorverarbeitung), Kombinieren der Variablen in einer einzelnen Indexvariable (Kombination) und Skalieren und Klassifizieren des resultierenden Index in aussagekräftigen Werten (Nachbearbeitung).

Weitere Informationen zur Funktionsweise von "Zusammengesetzten Index berechnen"

Abbildung

Abbildung des Werkzeugs "Zusammengesetzten Index berechnen"

Verwendung

  • Ob ein geeigneter Index erstellt wird, hängt von der sorgfältigen Betrachtung der Frage, die der Index versucht zu beantworten, der Auswahl der Variablen und der verwendeten Methoden ab. All dies sollte in Absprache mit Fachexperten und Endbenutzern erfolgen.

    Weitere Informationen zu Best Practices beim Erstellen von zusammengesetzten Indizes

  • Verwenden Sie den Parameter Eingabevariablen, um numerische Felder festzulegen, die im Index verwendet werden sollen. Datensätze mit fehlenden Werten in einer Eingabevariable werden durch das Werkzeug automatisch weggelassen.

  • Sie können den Parameter Voreingestellte Methode zum Skalieren und Kombinieren der Variablen verwenden, um eine Methode zum Erstellen eines Index anzugeben. Zum Beispiel werden bei der Option Werte kombinieren (Mittelwert der skalierten Werte) die Eingabevariablen zwischen 0 und 1 skaliert und der Mittelwert der neu skalierten Eingabevariablen als Index verwendet.

    • Der Parameter Voreingestellte Methode zum Skalieren und Kombinieren der Variablen ändert die Werte der Parameter Methode zum Skalieren der Eingabevariablen und Methode zum Kombinieren skalierter Variablen. Um diese weiter anzupassen, wählen Sie die Option Benutzerdefiniert aus, um die Werte manuell festzulegen.

  • Bei dem Parameter Methode zum Skalieren der Eingabevariablen wird die ausgewählte Methode auf alle Eingabevariablen angewendet.

    • Die Option Minimum-Maximum ist die einfachste Methode, da hiermit die Verteilung der Eingabevariablen erhalten wird und eine Skalierung im Bereich von 0 bis 1 durchgeführt wird, die leicht zu interpretieren ist.
    • Beim Arbeiten mit Variablen mit verzerrten Verteilungen oder Ausreißern sollten Sie die Methode Perzentil oder die Methode Rangstufe verwenden, die jeweils die Rangstufe der Daten berücksichtigt, oder die Option Nach Schwellenwert kennzeichnen (binär), bei der die Variablen in binäre Werte (0 oder 1) konvertiert werden.
    • Um einen Index zu erstellen, der immer wieder neu erstellt wird, wenn neue Daten verfügbar sind (zum Beispiel ein Index der jährlichen Entwicklung), verwenden Sie die Option Minimum-Maximum (benutzerdefinierte Datenbereiche) oder Z-Wert (benutzerdefiniert). Bei Verwendung einer dieser Optionen können Sie stabile Benchmarks festlegen, die Vergleiche von Daten mit verschiedenen Bereichen und Verteilungen ermöglichen.
    • Die Option Raw-Werte ist hilfreich, wenn die Variablen auf einer vergleichbaren Skala liegen, zum Beispiel wenn Prozentsätze verwendet werden oder wenn die Variablen mit anderen Werkzeugen vorverarbeitet wurden.

  • Verwenden Sie die Werkzeuge Feld transformieren, Feld standardisieren oder Feld reklassifizieren, wenn Sie Vorverarbeitungsmethoden verwenden müssen, die in diesem Werkzeug nicht verfügbar sind, oder wenn andere Vorverarbeitungsmethoden für jede Eingabevariable benötigt werden.

    • Beim Durchführen der Vorverarbeitung müssen Sie darauf achten, dass die Eingabevariablen auf einer vergleichbaren Skala liegen.
    • Verwenden Sie beim Durchführen einer eigenen Vorverarbeitung die Option Raw-Werte des Parameters Methode zum Skalieren der Eingabevariablen.

  • Wenn alle Eingabe auf einer einheitlichen Skala liegen, zum Beispiel Prozentsätze, dann verwenden Sie die Option Raw-Werte des Parameters Methode zum Skalieren der Eingabevariablen.

  • Die Option Nach Schwellenwert kennzeichnen (binär) des Parameters Methode zum Skalieren der Eingabevariablen kann verwendet werden, um basierend auf Schwellenwerten die Eingabevariablen in die Werte 0 und 1 zu konvertieren. Verwenden Sie den Parameter Methode zum Skalieren für Schwellenwerte, um vor dem Festlegen des Schwellenwertes zusätzlich einen Vorverarbeitungsschritt auf alle Variablen anzuwenden. Zum Beispiel wird mit den folgenden Schritten für jede Position die Anzahl der Eingabevariablen, die über dem 90. Perzentil liegen, gezählt:

    1. Legen Sie den Wert des Parameters Methode zum Skalieren der Eingabevariablen auf Nach Schwellenwert kennzeichnen (binär) fest.
    2. Legen Sie den Wert des Parameters Methode zum Skalieren für Schwellenwerte auf Perzentil fest.
    3. Legen Sie für jede Variable den Wert des Parameters Schwellenwerte auf Größer als 0,9 fest.
    4. Legen Sie den Wert des Parameters Methode zum Kombinieren skalierter Variablen auf Summe fest.

  • Der Parameter Methode zum Kombinieren skalierter Variablen enthält additive Methoden (Summe und Mittelwert) und multiplikative Methoden (Multiplizieren und Geometrischer Mittelwert).

    • Additive Methoden ermöglichen das Ersetzen von Variablen mit niedrigen Werten durch eine Variable mit einem hohen Wert.
    • Multiplikative Methoden ermöglichen das Ersetzen von niedrigen Werten durch hohe Werte nicht. Hohe Indexwerte treten nur dann auf, wenn in mehreren Variablen hohe Werte vorhanden sind.

  • Sie können den Parameter Gewichtungen (in der Parameterkategorie Variablengewichtungen) verwenden, um die relative Wichtigkeit einer Eingabevariable anzugeben. Alle Gewichtungen sind standardmäßig auf 1 festgelegt, was bedeutet, dass jede Variable gleich gewichtet ist.

    • Wenn Sie wissen, dass eine Variable zweimal so wichtig sein sollte wie eine andere Variable, dann legen Sie die Variable auf eine Gewichtung von 2 und die andere Variable auf eine Gewichtung von 1 fest.
    • Sie können auch Gewichtungen festlegen, die in der Summe 1 ergeben. Wenn zum Beispiel drei Variablen verwendet werden und die eine Variable zweimal so wichtig sein soll wie die anderen zwei Variablen, dann können Sie die Gewichtungswerte 0,5, 0,25 und 0,25 verwenden.

  • Gewichtungen haben einen signifikanten Einfluss auf den resultierenden Index. Da das Festlegen der relativen Wichtigkeit von Variablen ein subjektiver Teil der Analyse ist, sollten die Entscheidungen fachlich begründet und gut dokumentiert sein.

  • Das Werkzeug erstellt ein Indexfeld, ein Rangstufenfeld und ein Perzentil-Feld. Es wird auch ein Raw-Indexfeld erstellt, wenn eine Umkehrung angewendet oder der Index auf ein neues Minimum und Maximum skaliert wird. Für jede der Klassifizierungsoptionen, die im Parameter Zusätzliche klassifizierte Ausgaben angegeben wurden, werden zusätzliche Felder hinzugefügt. Wenn die Eingabe eine Feature-Class ist und für den Parameter Ausgabe-Features oder -Tabelle eine Feature-Class angegeben wurde, dann stellt das Werkzeug einen Gruppen-Layer bereit, in dem ein Layer für das Indexfeld, das Perzentil-Feld und jede der ausgewählten Klassifizierungsoptionen angezeigt wird.

  • Der Ausgabe-Index-Layer enthält Diagramme zum Anzeigen der Verteilung des Index, als Hilfe beim Ermitteln, ob die Vorverarbeitungsschritte das gewünschte Ergebnis erbracht haben, und zum Prüfen auf Korrelationen zwischen Eingabevariablen und dem Index.

  • Das Konzept, das der Index messen soll, kann durch mehrere Fachgebiete (auch als Dimensionen bezeichnet) dargestellt werden. Zum Beispiel könnte sich ein Gefährdungsindex aus den Fachgebieten Wohnen, Verkehrswesen und Einkommen, die jeweils aus mehreren Variablen bestehen, zusammensetzen. Sie sollten Teilindizes für die einzelnen Dimensionen erstellen. Um dies zu erreichen, muss das Werkzeug mehrmals, das heißt, einmal für jede Dimension, ausgeführt werden. Die Einzelergebnisse können dann als Eingabevariablen für den endgültigen Index verwendet werden.

  • Verwenden Sie beim Erstellen eines Index, der aus Teilindizes besteht, ModelBuilder oder ein Notebook in AllSource, um diesen Prozess zu optimieren. Wenn Sie ModelBuilder verwenden, erstellen Sie für jeden Teilindex neue Features, indem Sie den Parameter Felder an Eingabetabelle anhängen deaktivieren. Dadurch wird für jeden Teilindex eine eigene Ausgabe erstellt. Die einzelnen Ausgaben müssen vor dem Erstellen des endgültigen Index miteinander verbunden werden müssen. Das Verketten mehrerer Indizes wird in ModelBuilder von dem Werkzeug nicht unterstützt, wenn der Parameter Felder an Eingabetabelle anhängen aktiviert ist.

  • Es wird empfohlen, zwar die Anzahl der Eingabevariablen zu verringern, aber auch darauf zu achten, dass ausreichend Eingabevariablen vorhanden sind, mit denen die unverzichtbaren Informationen, die für den Index benötigt werden, erfasst werden können. Bei sehr vielen Eingabevariablen können Schwierigkeiten beim Interpretieren des Index entstehen. Wenn dann noch mehrere Variablen dasselbe Fachgebiet betreffen, zum Beispiel mittleres Einkommen und Armut, dann könnte der Einfluss dieses Fachgebietes im Index überrepräsentiert sein.

  • Das Werkzeug unterstützt derzeit keine Ausgabe-Features in Enterprise-Geodatabases, wenn Microsoft SQL Server oder Oracle, SQLite-Datenbanken oder mobile Geodatabases verwendet werden. Wenn der Parameter Felder an Eingabe-Features anhängen aktiviert ist und Microsoft SQL Server oder Oracle, eine SQLite-Datenbank oder GeoPackage-Dateien verwendet werden, darf sich die Eingabetabelle nicht in einer Enterprise-Geodatabase befinden.

Parameter

BeschriftungErläuterungDatentyp
Eingabetabelle

Die Tabelle oder die Features mit den Variablen, die zum Index kombiniert werden sollen.

Table View
Eingabevariablen

Eine Liste der numerischen Felder, die die Variablen darstellen, die als Index kombiniert werden sollen. Aktivieren Sie das Kontrollkästchen Richtung umkehren, um die Werte der Variablen umzukehren. Das bedeutet, dass das Feature oder der Datensatz, in dem ursprünglich der höchste Wert enthalten war, den niedrigsten Wert enthält und umgekehrt.

Value Table
Felder an Eingabetabelle anhängen
(optional)

Gibt an, ob die Ergebnisse an die Eingabedaten angehängt oder als Ausgabe-Feature-Class oder Tabelle bereitgestellt werden sollen.

  • Aktiviert: Die Ergebnisse werden an die Eingabedaten angehängt. Mit dieser Option werden die Eingabedaten geändert.
  • Deaktiviert: Es wird eine Ausgabe-Feature-Class oder Tabelle erstellt, in der die Ergebnisse enthalten sind. Dies ist die Standardeinstellung.

Boolean
Ausgabe-Features oder -Tabelle
(optional)

Die Ausgabe-Features oder -Tabelle, in der die Ergebnisse enthalten sein sollen.

Table; Feature Class
Voreingestellte Methode zum Skalieren und Kombinieren der Variablen
(optional)

Gibt den Workflow an, der beim Erstellen des Index verwendet werden soll. Die Optionen sind allgemeine Indexerstellungs-Workflows. Bei jeder Option werden Standardwerte für die Parameter Methode zum Skalieren der Eingabevariablen und Methode zum Kombinieren skalierter Variablen festgelegt.

  • Werte kombinieren (Mittelwert der skalierten Werte)Es wird ein Index erstellt, indem die Eingabevariablen zwischen 0 und 1 skaliert werden und der Durchschnitt der skalierten Werte gebildet wird. Diese Methode ist nützlich, um einen Index zu erstellen, der leicht interpretiert werden kann. Die Form der Verteilung und Ausreißer in den Eingabevariablen wirken sich auf den Index aus. Dies ist die Standardeinstellung.
  • Ränge kombinieren (Mittelwert der Perzentile)Es wird ein Index erstellt, indem die Ränge der Eingabevariablen zwischen 0 und 1 skaliert werden und der Durchschnitt der skalierten Ränge gebildet wird. Diese Option ist hilfreich, wenn die Ränge der Variablenwerte wichtiger sind als die Unterschiede zwischen den Werten. Die Form der Verteilung und Ausreißer in den Eingabevariablen wirken sich nicht auf den Index aus.
  • Unterschiede vergleichen (Geometrischer Mittelwert der skalierten Werte)Es wird ein Index erstellt, indem die Eingabevariablen zwischen 0 und 1 skaliert werden und der geometrische Durchschnitt der skalierten Werte berechnet wird. Da hohe Werte niedrige Werte nicht vollständig ausgleichen, ist diese Option hilfreich, um einen Index zu erstellen, in dem höhere Indexwerte nur dann auftreten, wenn in mehreren Variablen hohe Werte vorhanden sind.
  • Extremwerte hervorheben (Anzahl der Werte über dem 90. Perzentil)Es wird ein Index erstellt, der die Eingabevariablen mit Werten größer als oder gleich dem 90. Perzentil zählt. Diese Methode ist nützlich, um Positionen zu identifizieren, die als extremste Position oder als bedürftigste Position betrachtet werden kann.
  • BenutzerdefiniertEs wird ein Index unter Verwendung benutzerdefinierter Optionen für Skalierung und Kombination erstellt.
String
Methode zum Skalieren der Eingabevariablen
(optional)

Gibt die Methode an, die zum Konvertieren der Eingabevariablen in eine einheitliche Skalierung verwendet werden soll.

  • Minimum-MaximumDie Variablen werden unter Verwendung des Minimal- und des Maximalwertes jeder Variable zwischen 0 und 1 skaliert. Dies ist die Standardeinstellung.
  • Minimum-Maximum (benutzerdefinierte Datenbereiche)Die Variablen werden unter Verwendung des möglichen Minimal- und des möglichen Maximalwertes für jede Variable, die durch den Parameter Benutzerdefinierte Datenbereiche angegeben wurde, zwischen 0 und 1 skaliert. Für diese Methode gibt es viele Anwendungsfälle, zum Beispiel das Angeben des Minimums und Maximums basierend auf einer Benchmark, auf einer Referenzstatistik oder auf theoretischen Werten. Wenn zum Beispiel die aufgezeichneten Ozonwerte für einen Tag von 5 bis 27 Teilen pro Million (parts per million, ppm) reichen, dann können Sie das theoretische Minimum und Maximum basierend auf vorheriger Beobachtung und Fachwissen nutzen, um den Wert für den Parameter des möglichen Maximums und des möglichen Minimums festzulegen. Dadurch wird sichergestellt, dass der Index über mehrere Tage hinweg verglichen werden kann.
  • PerzentilDie Variablen werden in Perzentile zwischen 0 und 1 konvertiert, indem die Rangstufe der Datenwerte skaliert wird. Diese Option ist hilfreich, wenn Sie absolute Differenzen zwischen den Datenwerten ignorieren möchten, wie zum Beispiel bei Ausreißern und verzerrten Verteilungen.
  • RangstufeDie Variablen werden nach Rangordnung sortiert. Dem kleinsten Wert wird der Rangstufenwert 1 zugewiesen, dem nächsten Wert wird der Rangstufenwert 2 zugewiesen und so weiter. Gleichständen wird der Durchschnitt ihrer Ränge zugewiesen.
  • Z-WertJede Variable wird standardisiert, indem der Mittelwert subtrahiert und durch die Standardabweichung dividiert wird (als Z-Wert bezeichnet). Der Z-Wert ist die Anzahl der Standardabweichungen oberhalb oder unterhalb des Mittelwertes. Diese Option ist hilfreich, wenn die Mittelwerte der Variablen wichtige Vergleichspunkte sind. Werte oberhalb des Mittelwertes erhalten positive Z-Werte, und Werte unterhalb des Mittelwertes erhalten negative Z-Werte.
  • Z-Wert (benutzerdefiniert)Jede Variable wird standardisiert, indem ein benutzerdefinierter Mittelwert subtrahiert und durch eine benutzerdefinierte Standardabweichung dividiert wird. Geben Sie die benutzerdefinierten Werte im Parameter Benutzerdefinierte Standardisierung an. Diese Option ist hilfreich, wenn die Mittelwerte und Standardabweichungen der Variablen aus vorheriger Recherche bekannt sind.
  • Nach Schwellenwert kennzeichnen (binär)Variablen werden identifiziert, wenn sie über oder unter einem definierten Schwellenwert liegen. Das resultierende Feld enthält binäre Werte (0 oder 1), die angeben, ob der Schwellenwert überschritten wurde. Sie können auch den Parameter Methode zum Skalieren für Schwellenwerte verwenden, um vor dem Definieren des Schwellenwertes die Werte der Eingabevariablen zu skalieren, und den Parameter Schwellenwerte verwenden, um die Schwellenwerte anzugeben. Diese Option ist hilfreich, wenn die Werte der Variablen weniger wichtig sind als die Tatsache, ob sie einen bestimmten Schwellenwert überschritten haben, wie zum Beispiel den Sicherheitsgrenzwert eines Schadstoffs.
  • Raw-WerteDie ursprünglichen Werte der Variablen werden verwendet. Verwenden Sie diese Methode nur dann, wenn alle Variablen in einem vergleichbaren Maßstab gemessen werden, wie zum Beispiel Prozentsätze oder Verhältnisse, oder wenn die Variablen vor der Verwendung dieses Werkzeugs standardisiert wurden.
String
Methode zum Skalieren für Schwellenwerte
(optional)

Gibt die Methode an, die vor dem Festlegen der Schwellenwerte zum Konvertieren der Eingabevariablen in einen einheitlichen Maßstab verwendet werden soll.

  • Minimum-MaximumDie Variablen zwischen 0 und 1 werden unter Verwendung des Minimal- und des Maximalwertes jeder Variable skaliert.
  • Minimum-Maximum (benutzerdefinierte Datenbereiche)Die Variablen zwischen 0 und 1 werden unter Verwendung des möglichen Minimal- und des möglichen Maximalwertes für jede Variable skaliert.
  • PerzentilDie Variablen werden in Perzentile zwischen 0 und 1 konvertiert.
  • Z-WertJede Variable wird standardisiert, indem der Mittelwert subtrahiert und durch die Standardabweichung dividiert wird.
  • Z-Wert (benutzerdefiniert)Jede Variable wird standardisiert, indem ein benutzerdefinierter Mittelwert subtrahiert und durch eine benutzerdefinierte Standardabweichung dividiert wird.
  • Raw-WerteDie Werte der Variablen werden ohne Änderung verwendet. Dies ist die Standardeinstellung.
String
Benutzerdefinierte Standardisierung
(optional)

Der benutzerdefinierte Mittelwert und die benutzerdefinierte Standardabweichung, die beim Standardisieren jeder Eingabevariable verwendet werden sollen. Geben Sie für jede Variable den benutzerdefinierten Mittelwert in der Spalte Mittelwert und die benutzerdefinierte Standardabweichung in der Spalte Standardabweichung an.

Value Table
Benutzerdefinierte Datenbereiche
(optional)

Die möglichen Minimal- und Maximalwerte, die in den Einheiten der Variablen verwendet werden sollen. Jede Variable wird basierend auf dem möglichen Mindestwert und dem möglichen Höchstwert zwischen 0 und 1 skaliert.

Value Table
Schwellenwerte
(optional)

Der Schwellenwert, der bestimmt, ob ein Feature gekennzeichnet werden soll. Geben Sie den Wert in den Einheiten der skalierten Variables an, und geben Sie an, ob Werte über oder unter dem Schwellenwert gekennzeichnet werden sollen.

Value Table
Methode zum Kombinieren skalierter Variablen
(optional)

Gibt die Methode an, die zum Kombinieren der skalierten Variablen in einen einzelnen Wert verwendet werden soll.

Wenn Variablen unter Verwendung von Z-Werten skaliert wurden, dann können Sie einen geometrischen Mittelwert weder multiplizieren noch berechnen, da Z-Werte immer negative Werte enthalten.

  • SummeDie Werte werden addiert.
  • MittelwertDer arithmetische (additive) Mittelwert der Werte wird berechnet. Dies ist die Standardeinstellung.
  • MultiplizierenDie Werte werden multipliziert. Alle Maßstabswerte müssen größer oder gleich null sein
  • Geometrischer MittelwertDer geometrische (multiplikative) Mittelwert der Werte wird berechnet. Alle Maßstabswerte müssen größer oder gleich null sein
String
Gewichtungen
(optional)

Die Gewichtungen, die den relativen Einfluss einer Eingabevariable auf den Index festlegen sollen. Jede Gewichtung hat den Standardwert 1. Das bedeutet, dass jede Variable gleichermaßen beiträgt. Erhöhen oder verringern Sie die Gewichtungen entsprechend der relativen Wichtigkeit der Variablen. Wenn zum Beispiel eine Variable zweimal so wichtig ist wie eine andere Variable, dann verwenden Sie eine Gewichtung mit dem Wert 2. Wenn beim Multiplizieren zum Kombinieren skalierter Variablen Gewichtungen mit Werten größer als 1 verwendet werden, dann können Indizes mit sehr großen Werten entstehen.

Value Table
Ausgabe-Indexname
(optional)

Der Name des Indexes. Der Wert wird in der Visualisierung der Ausgaben verwendet, zum Beispiel Feld-Aliasnamen und Diagrammbeschriftungen . Der Wert wird nicht verwendet, wenn die Ausgabe (oder angehängte Eingabe) ein Shapefile ist.

String
Ausgabe-Indexwerte umkehren
(optional)

Gibt an, ob die Richtung der Ausgabe-Indexwerte umgekehrt werden soll (zum Beispiel, um hohe Indexwerte als niedrige Werte zu behandeln).

  • Aktiviert: Die Richtung der Ausgabe-Indexwerte wird umgekehrt.
  • Deaktiviert: Die Richtung der Ausgabe-Indexwerte wird nicht umgekehrt. Dies ist die Standardeinstellung.

Boolean
Minimal- und Maximalwerte des Ausgabe-Index
(optional)

Das Minimum und das Maximum der Ausgabe-Indexwerte. Diese Skalierung wird nach dem Kombinieren der skalierten Variablen angewendet. Wenn keine Werte angegeben wurden, wird der Ausgabe-Index nicht skaliert.

Value Table
Zusätzliche klassifizierte Ausgaben
(optional)

Gibt die Methode an, die zum Klassifizieren des Ausgabe-Index verwendet werden soll. Für jede ausgewählte Option wird ein zusätzliches Ausgabefeld bereitgestellt.

  • Gleiches IntervallEs werden Klassen erstellt, indem der Wertebereich in Intervalle gleicher Größe aufgeteilt wird.
  • QuantilEs werden Klassen erstellt, bei denen jede Klasse die gleiche Anzahl der Datensätze enthält.
  • StandardabweichungEs werden Klassen erstellt, die der Anzahl der Standardabweichungen ober- und unterhalb vom Durchschnitt des Index entsprechen. Die resultierenden Werte liegen zwischen -3 und 3.
  • BenutzerdefiniertKlassengrenzen und Klassenwerte werden mit dem Parameter Benutzerdefinierte Klassen des Ausgabe-Index angegeben.
String
Anzahl der Klassen des Ausgabe-Index
(optional)

Die Anzahl der Klassen, die für die Klassifizierungsmethoden "Gleiches Intervall" und "Quantil" verwendet werden sollen.

Long
Benutzerdefinierte Klassen des Ausgabe-Index
(optional)

Die oberen Grenzen und Klassenwerte für die benutzerdefinierte Klassifizierungsmethode. Diese Variable können Sie zum Beispiel zum Klassifizieren eines Index, der Werte zwischen 0 und 100 enthält, basierend auf benutzerdefinierten Unterbrechungswerten in Klassen, die niedrige, mittlere und hohe Werte darstellen, verwenden.

Value Table

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Aktualisierte Eingabetabelle

Die aktualisierte Eingabetabelle.

Feature Layer; Table View
Ausgabe-Layer-Gruppe

Wenn die Eingabe eine Feature-Class war und für den Parameter Ausgabe-Features oder -Tabelle eine Feature-Class angegeben wurde, dann wird ein Gruppen-Layer bereitgestellt, in dem ein Layer für das Indexfeld, das Perzentil-Feld und jede der ausgewählten Klassifizierungsoptionen angezeigt wird.

Group Layer

arcpy.stats.CalculateCompositeIndex(in_table, in_variables, {append_to_input}, {out_table}, {index_preset}, {preprocessing}, {pre_threshold_scaling}, {pre_custom_zscore}, {pre_min_max}, {pre_thresholds}, {index_method}, {index_weights}, {out_index_name}, {out_index_reverse}, {post_min_max}, {post_reclass}, {post_num_classes}, {post_custom_classes})
NameErläuterungDatentyp
in_table

Die Tabelle oder die Features mit den Variablen, die zum Index kombiniert werden sollen.

Table View
in_variables
[[var1, reverse1],[var2, reverse2],...]

Eine Liste der numerischen Felder, die die Variablen darstellen, die als Index kombiniert werden sollen. Die Spalte "Richtung umkehren" kehrt die Werte der Variablen um. Das bedeutet, dass das Feature oder der Datensatz, in dem ursprünglich der höchste Wert enthalten war, den niedrigsten Wert enthält und umgekehrt. Die Werte werden nach Skalieren umgekehrt.

Value Table
append_to_input
(optional)

Gibt an, ob die Ergebnisse an die Eingabedaten angehängt oder als Ausgabe-Feature-Class oder Tabelle bereitgestellt werden sollen.

  • APPEND_TO_INPUTDie Ergebnisse werden an die Eingabedaten angehängt. Mit dieser Option werden die Eingabedaten geändert.
  • NEW_FEATURESEs wird eine Ausgabe-Feature-Class oder Tabelle erstellt, in der die Ergebnisse enthalten sind. Dies ist die Standardeinstellung.
Boolean
out_table
(optional)

Die Ausgabe-Features oder -Tabelle, in der die Ergebnisse enthalten sein sollen.

Table; Feature Class
index_preset
(optional)

Gibt den Workflow an, der beim Erstellen des Index verwendet werden soll. Die Optionen sind allgemeine Indexerstellungs-Workflows. Bei jeder Option werden Standardwerte für die Parameter preprocessing und index_method festgelegt.

  • MEAN_SCALEDEs wird ein Index erstellt, indem die Eingabevariablen zwischen 0 und 1 skaliert werden und der Durchschnitt der skalierten Werte gebildet wird. Diese Methode ist nützlich, um einen Index zu erstellen, der leicht interpretiert werden kann. Die Form der Verteilung und Ausreißer in den Eingabevariablen wirken sich auf den Index aus. Dies ist die Standardeinstellung.
  • MEAN_PCTLEs wird ein Index erstellt, indem die Ränge der Eingabevariablen zwischen 0 und 1 skaliert werden und der Durchschnitt der skalierten Ränge gebildet wird. Diese Option ist hilfreich, wenn die Ränge der Variablenwerte wichtiger sind als die Unterschiede zwischen den Werten. Die Form der Verteilung und Ausreißer in den Eingabevariablen wirken sich nicht auf den Index aus.
  • GEOMEAN_SCALEDEs wird ein Index erstellt, indem die Eingabevariablen zwischen 0 und 1 skaliert werden und der geometrische Durchschnitt der skalierten Werte berechnet wird. Da hohe Werte niedrige Werte nicht verdrängen, ist diese Option hilfreich, um einen Index zu erstellen, in dem höhere Indexwerte nur dann auftreten, wenn in mehreren Variablen hohe Werte vorhanden sind.
  • SUM_FLAGSPCTLEs wird ein Index erstellt, der die Eingabevariablen mit Werten größer als oder gleich dem 90. Perzentil zählt. Diese Methode ist nützlich, um Positionen zu identifizieren, die als extremste Position oder als bedürftigste Position betrachtet werden kann.
  • CUSTOMEs wird ein Index unter Verwendung benutzerdefinierter Optionen für Skalierung und Kombination erstellt.
String
preprocessing
(optional)

Gibt die Methode an, die zum Konvertieren der Eingabevariablen in eine einheitliche Skalierung verwendet werden soll.

  • MINMAXDie Variablen werden unter Verwendung des Minimal- und des Maximalwertes jeder Variable zwischen 0 und 1 skaliert. Dies ist die Standardeinstellung.
  • CUST_MINMAXDie Variablen werden unter Verwendung des möglichen Minimal- und des möglichen Maximalwertes für jede Variable, die durch den Parameter pre_min_max angegeben wurde, zwischen 0 und 1 skaliert. Für diese Methode gibt es viele Anwendungsfälle, zum Beispiel das Angeben des Minimums und Maximums basierend auf einer Benchmark, auf einer Referenzstatistik oder auf theoretischen Werten. Wenn zum Beispiel die aufgezeichneten Ozonwerte für einen Tag von 5 bis 27 Teilen pro Million (parts per million, ppm) reichen, dann können Sie das theoretische Minimum und Maximum basierend auf vorheriger Beobachtung und Fachwissen nutzen, um sicherzustellen, dass der Index über mehrere Tage verglichen werden kann.
  • PERCENTILEDie Variablen werden in Perzentile zwischen 0 und 1 konvertiert, indem der Prozentsatz der Datenwerte, die kleiner als der Datenwert sind, berechnet wird. Diese Option ist hilfreich, wenn Sie absolute Differenzen zwischen den Datenwerten ignorieren möchten, wie zum Beispiel bei Ausreißern und verzerrten Verteilungen.
  • RANKDie Variablen werden nach Rangordnung sortiert. Dem kleinsten Wert wird der Rangstufenwert 1 zugewiesen, dem nächsten Wert wird der Rangstufenwert 2 zugewiesen und so weiter. Gleichständen wird der Durchschnitt ihrer Ränge zugewiesen.
  • ZSCOREJede Variable wird standardisiert, indem der Mittelwert subtrahiert und durch die Standardabweichung dividiert wird (als Z-Wert bezeichnet). Der Z-Wert ist die Anzahl der Standardabweichungen oberhalb oder unterhalb des Mittelwertes. Diese Option ist hilfreich, wenn die Mittelwerte der Variablen wichtige Vergleichspunkte sind. Werte oberhalb des Mittelwertes erhalten positive Z-Werte, und Werte unterhalb des Mittelwertes erhalten negative Z-Werte.
  • CUST_ZSCOREJede Variable wird standardisiert, indem ein benutzerdefinierter Mittelwert subtrahiert und durch eine benutzerdefinierte Standardabweichung dividiert wird. Geben Sie die benutzerdefinierten Werte im Parameter pre_custom_zscore an. Diese Option ist hilfreich, wenn die Mittelwerte und Standardabweichungen der Variablen aus vorheriger Recherche bekannt sind.
  • BINARYVariablen werden identifiziert, wenn sie über oder unter einem definierten Schwellenwert liegen. Das resultierende Feld enthält binäre Werte (0 oder 1), die angeben, ob der Schwellenwert überschritten wurde. Sie können auch den Parameter pre_threshold_scaling verwenden, um vor dem Definieren des Schwellenwertes die Werte der Eingabevariablen zu skalieren, und den Parameter pre_thresholds verwenden, um die Schwellenwerte anzugeben. Diese Option ist hilfreich, wenn die Werte der Variablen weniger wichtig sind als die Tatsache, ob sie einen bestimmten Schwellenwert überschritten haben, wie zum Beispiel den Sicherheitsgrenzwert eines Schadstoffs.
  • RAWDie ursprünglichen Werte der Variablen werden verwendet. Verwenden Sie diese Methode nur dann, wenn alle Variablen in einem vergleichbaren Maßstab gemessen werden, wie zum Beispiel Prozentsätze oder Verhältnisse, oder wenn die Variablen vor der Verwendung dieses Werkzeugs standardisiert wurden.
String
pre_threshold_scaling
(optional)

Gibt die Methode an, die vor dem Festlegen der Schwellenwerte zum Konvertieren der Eingabevariablen in einen einheitlichen Maßstab verwendet werden soll.

  • THRESHOLD_MINMAXDie Variablen zwischen 0 und 1 werden unter Verwendung des Minimal- und des Maximalwertes jeder Variable skaliert.
  • THRESHOLD_CUST_MINMAXDie Variablen zwischen 0 und 1 werden unter Verwendung des möglichen Minimal- und des möglichen Maximalwertes für jede Variable skaliert.
  • THRESHOLD_PERCENTILEDie Variablen werden in Perzentile zwischen 0 und 1 konvertiert.
  • THRESHOLD_ZSCOREJede Variable wird standardisiert, indem der Mittelwert subtrahiert und durch die Standardabweichung dividiert wird.
  • THRESHOLD_CUST_ZSCOREJede Variable wird standardisiert, indem ein benutzerdefinierter Mittelwert subtrahiert und durch eine benutzerdefinierte Standardabweichung dividiert wird.
  • THRESHOLD_RAWDie Werte der Variablen werden ohne Änderung verwendet. Dies ist die Standardeinstellung.
String
pre_custom_zscore
[[field1, mean1, stdev1], [field2, mean2, stdev2],...]
(optional)

Der benutzerdefinierte Mittelwert und die benutzerdefinierte Standardabweichung, die beim Standardisieren jeder Eingabevariable verwendet werden sollen. Geben Sie für jede Variable den benutzerdefinierten Mittelwert in der Spalte Mittelwert und die benutzerdefinierte Standardabweichung in der Spalte Standardabweichung an.

Value Table
pre_min_max
[[field1, min1, max1], [field2, min2, max2],...]
(optional)

Die möglichen Minimal- und Maximalwerte, die in den Einheiten der Variablen verwendet werden sollen. Jede Variable wird basierend auf dem möglichen Mindestwert und dem möglichen Höchstwert zwischen 0 und 1 skaliert.

Value Table
pre_thresholds
[[field1, method1, threshold1], [field2, method2, threshold2],...]
(optional)

Der Schwellenwert, der bestimmt, ob ein Feature gekennzeichnet werden soll. Geben Sie den Wert in den Einheiten der skalierten Variables an, und geben Sie an, ob Werte über oder unter dem Schwellenwert gekennzeichnet werden sollen.

Value Table
index_method
(optional)

Gibt die Methode an, die zum Kombinieren der skalierten Variablen in einen einzelnen Wert verwendet werden soll.

  • SUMDie Werte werden addiert.
  • MEANDer arithmetische (additive) Mittelwert der Werte wird berechnet. Dies ist die Standardeinstellung.
  • PRODUCTDie Werte werden multipliziert. Alle Maßstabswerte müssen größer oder gleich null sein
  • GEOMETRIC_MEANDer geometrische (multiplikative) Mittelwert der Werte wird berechnet. Alle Maßstabswerte müssen größer oder gleich null sein

Wenn Variablen unter Verwendung von Z-Werten skaliert wurden, dann können Sie einen geometrischen Mittelwert weder multiplizieren noch berechnen, da Z-Werte immer negative Werte enthalten.

String
index_weights
[[field1, weight1], [field2, weight2],...]
(optional)

Die Gewichtungen, die den relativen Einfluss einer Eingabevariable auf den Index festlegen sollen. Jede Gewichtung hat den Standardwert 1. Das bedeutet, dass jede Variable gleichermaßen beiträgt. Erhöhen oder verringern Sie die Gewichtungen entsprechend der relativen Wichtigkeit der Variablen. Wenn zum Beispiel eine Variable zweimal so wichtig ist wie eine andere Variable, dann verwenden Sie eine Gewichtung mit dem Wert 2. Wenn beim Multiplizieren zum Kombinieren skalierter Variablen Gewichtungen mit Werten größer als 1 verwendet werden, dann können Indizes mit sehr großen Werten entstehen.

Value Table
out_index_name
(optional)

Der Name des Indexes. Der Wert wird in der Visualisierung der Ausgaben verwendet, zum Beispiel Feld-Aliasnamen und Diagrammbeschriftungen . Der Wert wird nicht verwendet, wenn die Ausgabe (oder angehängte Eingabe) ein Shapefile ist.

String
out_index_reverse
(optional)

Gibt an, ob die Richtung der Ausgabe-Indexwerte umgekehrt werden soll (zum Beispiel, um hohe Indexwerte als niedrige Werte zu behandeln).

  • REVERSEDie Richtung der Ausgabe-Indexwerte wird umgekehrt.
  • NO_REVERSEDie Richtung der Ausgabe-Indexwerte wird nicht umgekehrt. Dies ist die Standardeinstellung.
Boolean
post_min_max
[min1, max1], [min2, max2]
(optional)

Das Minimum und das Maximum der Ausgabe-Indexwerte. Diese Skalierung wird nach dem Kombinieren der skalierten Variablen angewendet. Wenn keine Werte angegeben wurden, wird der Ausgabe-Index nicht skaliert.

Value Table
post_reclass
[post_reclass,...]
(optional)

Gibt die Methode an, die zum Klassifizieren des Ausgabe-Index verwendet werden soll. Für jede ausgewählte Option wird ein zusätzliches Ausgabefeld bereitgestellt.

  • EQINTERVALEs werden Klassen erstellt, indem der Wertebereich in Intervalle gleicher Größe aufgeteilt wird.
  • QUANTILEEs werden Klassen erstellt, bei denen jede Klasse die gleiche Anzahl der Datensätze enthält.
  • STDDEVEs werden Klassen erstellt, die der Anzahl der Standardabweichungen ober- und unterhalb vom Durchschnitt des Index entsprechen. Die resultierenden Werte liegen zwischen -3 und 3.
  • CUSTKlassengrenzen und Klassenwerte werden mit dem Parameter post_custom_classes angegeben.
String
post_num_classes
(optional)

Die Anzahl der Klassen, die für die Klassifizierungsmethoden "Gleiches Intervall" und "Quantil" verwendet werden sollen.

Long
post_custom_classes
[[min1, max1], [min2, max2],...]
(optional)

Die oberen Grenzen und Klassenwerte für die benutzerdefinierte Klassifizierungsmethode. Diese Variable können Sie zum Beispiel zum Klassifizieren eines Index, der Werte zwischen 0 und 100 enthält, basierend auf benutzerdefinierten Unterbrechungswerten in Klassen, die niedrige, mittlere und hohe Werte darstellen, verwenden.

Value Table

Abgeleitete Ausgabe

NameErläuterungDatentyp
updated_table

Die aktualisierte Eingabetabelle.

Feature Layer; Table View
output_layer_group

Wenn die Eingabe eine Feature-Class war und für den Parameter out_table eine Feature-Class angegeben wurde, dann wird ein Gruppen-Layer bereitgestellt, in dem ein Layer für das Indexfeld, das Perzentil-Feld und jede der ausgewählten Klassifizierungsoptionen angezeigt wird.

Group Layer

Codebeispiel

CalculateCompositeIndex: Beispiel 1 (Python-Fenster)

Das folgende Python-Skript veranschaulicht, wie die Funktion CalculateCompositeIndex verwendet wird.


import arcpy
arcpy.stats.CalculateCompositeIndex(
    in_table=r"C:\MyData.gdb\CommunityCharacteristics", 
    out_table=r"C:\MyData.gdb\CommunityCharacteristicsIndex",
    in_variables=["ASTHMA_Prevalence_Percent", "Health_NoInsurance_Percent", 
                    "BelowPovertyLine_Percent"],
    index_preset="MEAN_SCALED")
CalculateCompositeIndex: Beispiel 2 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion CalculateCompositeIndex verwendet wird.


# Import system modules 
import arcpy 
import os 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\temp\temp.gdb" 
    arcpy.env.overwriteOutput = True 
    
    # Set the input point feature parameters
    input_features = os.path.join(arcpy.env.workspace, "CommunityCharacteristics")

    # Set a list of variables that will be combined into an index
    input_variables = ["ASTHMA_Prevalence_Percent", "Health_NoInsurance_Percent", 
                       "BelowPovertyLine_Percent"]

    # Set the output name that will contain the index values.
    output_features = os.path.join(arcpy.env.workspace, "CommunityCharacteristicsIndex")

    # Set the method to scale the input variables
    preprocessing_method = "PERCENTILE"

    # Set the method to combine the input variables
    combination_method = "MEAN"
    variable_weights = [["ASTHMA_Prevalence_Percent", 2],
                        ["Health_NoInsurance_Percent", 1],
                        ["BelowPovertyLine_Percent", 1]]

    # Set the output settings
    output_index_name = "Asthma_Needs_Index"
    output_index_range = "0 100"
    output_classification = "QUANTILE"
    output_classification_num_classes = 5

    # Call the tool using the parameters defined above.
    arcpy.stats.CalculateCompositeIndex(
        in_table=input_features,
        in_variables=input_variables, 
        out_table=output_features,
        index_preset="CUSTOM",
        preprocessing=preprocessing_method,
        index_method=combination_method,
        index_weights=variable_weights,
        out_index_name=output_index_name,
        post_min_max=output_index_range,
        post_reclass=output_classification,
        post_num_classes=output_classification_num_classes)

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())