Auf Vorhandensein beschränkte Vorhersage (MaxEnt) (Spatial Statistics)

Zusammenfassung

Modelliert anhand der maximalen Entropie (MaxEnt) das Vorhandensein eines Phänomens, wenn Positionen des Vorhandenseins und erklärende Variablen gegeben sind. Das Werkzeug stellt Ausgabe-Features und -Raster bereit, die die Wahrscheinlichkeit für das Vorhandensein enthalten, und kann auf Probleme angewendet werden, bei denen nur das Vorhandensein bekannt ist und das Fehlen nicht bekannt ist.

Weitere Informationen zur Funktionsweise von "Auf Vorhandensein beschränkte Vorhersage (MaxEnt)"

Abbildung

Abbildung des Werkzeugs "Auf Vorhandensein beschränkte Vorhersage (MaxEnt)"

Verwendung

  • Das Werkzeug verwendet drei primäre Eingaben, um ein Modell zur Vorhersage des Vorhandenseins zu erstellen: bekannte Positionen des Vorhandenseins, ein Untersuchungsgebiet, in dem Vorhandensein möglich ist, und erklärende Variablen.

    • Der Parameterwert Eingabe-Punkt-Features wird verwendet, um bekannte Positionen des Vorhandenseins eines relevanten Phänomens zu bezeichnen.
    • Das Untersuchungsgebiet wird durch Hintergrundpunkte gekennzeichnet. Hintergrundpunkte sind auf das Untersuchungsgebiet verteilte Positionen, an denen das Vorhandensein des relevanten Phänomens möglich, aber unbekannt ist. Sie können automatisch vom Werkzeug erstellt werden oder manuell zusammen mit den Eingabe-Punkt-Features eingebunden werden, indem der Parameter Enthält Hintergrundpunkte aktiviert wird.
    • Das Werkzeug akzeptiert erklärende Variablen in Form von Rastern, Feldern und Entfernungs-Features.

  • Das Werkzeug kann in zwei Modi ausgeführt werden, die mit dem Parameter Enthält Hintergrundpunkte angegeben werden:

    • Deaktiviert: Das Werkzeug wird mit auf Vorhandensein beschränkten Punkten ausgeführt, und erklärende Variablen werden nur aus Raster-Quellen akzeptiert.
    • Aktiviert: Das Werkzeug wird mit Punkten des Vorhandenseins und Hintergrundpunkten ausgeführt, und als Quellen für erklärende Variablen sind Raster, Felder in den Eingabe-Punkt-Features und Entfernungs-Features zulässig.

  • Für die Verwendung von Rastern als Eingabe oder Ausgabe für das Werkzeug ist eine Erweiterung "ArcGIS Spatial Analyst"-Lizenz erforderlich.

  • Der Parameter Trainierte Ausgabe-Modelldatei kann verwendet werden, um die Ergebnisse des trainierten Modells als Datei zu speichern, die wiederverwendet werden kann. Das Werkzeug Mit Modelldatei für räumliche Statistiken vorhersagen kann verwendet werden, um mit der Modelldatei neue Features vorherzusagen.

  • Zum Erstellen eines Modells mit dem Werkzeug sind mindestens zwei Punkte des Vorhandenseins in den Eingabe-Punkt-Features erforderlich. Wenn die Eingabe-Features Hintergrundpunkte enthalten, sind zum Erstellen eines Modells außerdem mindestens zwei Hintergrundpunkte erforderlich.

  • Der Parameter Erklärende Trainings-Entfernungs-Features ist deaktiviert, wenn der Parameter Enthält Hintergrundpunkte deaktiviert ist. Um Entfernungen als erklärende Variablen für auf Vorhandensein beschränkte Daten in Features einzubeziehen, können mit dem Werkzeug Entfernungsakkumulation Entfernungs-Raster berechnet werden, und diese können in den Parameter Erklärende Trainings-Raster aufgenommen werden.

  • Die räumliche Auflösung der Werte des Parameters Erklärende Trainings-Raster ist aus folgenden Gründen wichtig:

    • Die Zellengrößen haben eine erhebliche Auswirkung auf die Verarbeitungszeit. Je höher die Raster-Auflösung, desto länger die Verarbeitungszeit.
    • Bei Verwendung von auf Vorhandensein beschränkten Daten (der Parameter Enthält Hintergrundpunkte ist deaktiviert) generiert das Werkzeug Hintergrundpunkte anhand der Zellenschwerpunkte der Raster. Das Verhältnis der Hintergrundpunkte zu den Punkten des Vorhandenseins wirkt sich auf das Modell aus. Es wird empfohlen, die Zellengröße der Raster zu berücksichtigen und mit dem Parameter Trainierte Ausgabe-Features die resultierenden Hintergrundpunkte zu untersuchen, um sicherzustellen, dass sich die Annahmen zum Untersuchungsgebiet für Ihre Fragestellung eignen.
      Hinweis:

      Sie können das Werkzeug Resampling verwenden, um die räumliche Auflösung der erklärenden Trainings-Raster zu verringern.

  • Das mit dem Parameter Untersuchungsgebiet oder anhand der Positionen der Eingabe-Punkt-Features, die Hintergrundpunkte enthalten, definierte Untersuchungsgebiet beeinflusst das Ergebnis des Modells. Die verwendete Ausdehnung bestimmt, welche Raster-Zellen als Hintergrundpunkte verwendet werden. Hierdurch werden die Umgebungsbedingungen festgelegt, die mit Bedingungen des Vorhandenseins verglichen werden und eine relative Häufigkeit bestimmen, die sich auf die Vorhersageergebnisse auswirkt.

  • Legen Sie mit dem Parameter Relative Gewichtung von Vorhandensein zu Hintergrund die Bedeutung der Hintergrundpunkte fest. Verwenden Sie den Wert 100, wenn Hintergrundpunkte Positionen mit unbekanntem Vorhandensein darstellen. Verwenden Sie den Wert 1, wenn Hintergrundpunkte Positionen mit beobachtetem Fehlen darstellen.

    • Der Wert wirkt sich auf die Funktion des Modells und die resultierenden Vorhersagen des Werkzeugs aus. Wenn der Wert nahe 100 ist, sanktioniert das Modell jeden fehlklassifizierten Punkt des Vorhandenseins 100 Mal stärker als jeden fehlklassifizierten Hintergrundpunkt (unter der Annahme, dass Fehlen die richtige Klassifizierung des Hintergrundes ist), und es wird die herkömmliche MaxEnt-Methode angewendet. Wenn der Wert 1 lautet, sanktioniert das Modell jeden Punkt des Vorhandenseins und Hintergrundpunkt in gleichem Maße und ähnelt der logistischen Regression.
    • Bei Verwendung des auf Vorhandensein beschränkten Modus (der Parameter Enthält Hintergrundpunkte ist deaktiviert) sollte der Wert 1 mit Vorsicht verwendet werden, da das Werkzeug Hintergrundpunkte generiert, die als Fehlen behandelt werden und die gleiche Gewichtung wie die angegebenen Punkte des Vorhandensein erhalten.

  • Die meisten Daten für Vorhandensein weisen eine Stichprobenverzerrung auf, und diese wirkt sich auf die Ergebnisse der Analyse aus. Mit dem Werkzeug Räumliche Ausdünnung können Sie diese Auswirkungen verringern. Mit "Räumliche Ausdünnung" lassen sich zwar die Auswirkungen der Stichprobenverzerrung reduzieren, es wird jedoch empfohlen, dass Sie Daten aus strukturierten Surveys verwenden, um diese Auswirkungen noch stärker zu verringern.

  • Klassifizierungsdiagnosen sind aus Geoverarbeitungsmeldungen und über das Diagramm Prozentsätze der Klassifizierungsergebnisse verfügbar, das mit dem aus dem Wert des Parameters Trainierte Ausgabe-Features resultierenden Layer bereitgestellt wird. Im Diagramm wird ein Vergleich der beobachteten und vorhergesagten Klassifizierungen angezeigt. Sie können es verwenden, um die Fähigkeit des Modells zum Vorhersagen der Performance an bekannten Punkten des Vorhandenseins zu bewerten. Sie können beispielsweise die Fähigkeit des Modells zum Vorhersagen des Vorhandenseins bewerten, indem Sie sich auf den Anteil der fehlklassifizierten Punkte des Vorhandenseins in den Trainings-Eingabe-Punkt-Features konzentrieren. In Anwendungsfällen, in denen die Vorhersage des Vorhandenseins für Hintergrundpunkte wichtig ist, können Sie mithilfe des Diagramms auch die Hintergrundpunkte anzeigen und auswählen, für die Vorhandensein vorhergesagt ist.

  • Sie können das Werkzeug auf zwei Arten verwenden. Sie können sich auf das Trainieren und Auswerten potenzieller Modelle oder auf das Vorhersagen von Wahrscheinlichkeiten des Vorhandenseins in einem neuen Dataset konzentrieren.

    • Trainieren und Auswerten potenzieller Modelle: Führen Sie das Werkzeug aus, ohne Ausgaben anzugeben, um die Modelldiagnosen in den Geoverarbeitungsmeldungen auszuwerten. Sobald die Diagnoseergebnisse geeignet zu sein scheinen, geben Sie einen Wert für den Parameter Trainierte Ausgabe-Features an, und verwenden Sie die Diagramme der Klassifizierungsdiagnosen, um die Vorhersage-Performance für die Trainingsdaten genauer zu beurteilen. Die mit den Parameterwerten für Ausgabe-Empfindlichkeitstabelle und Ausgabe-Antwortkurventabelle bereitgestellten Diagramme stellen Diagnosekennwerte für die Trainingsdaten dar und sind ebenfalls beim Anpassen und Ermitteln eines geeigneten Modells hilfreich.
    • Vorhersage: Geben Sie die Parameter in der Parameterkategorie Vorhersageoptionen an, um das Modell auf neue Positionen anzuwenden, die nicht in den Trainingsdaten enthalten sind. Die Werte des Parameters Eingabe-Vorhersage-Features und des resultierenden Parameters Ausgabe-Vorhersage-Features stellen neue Punktpositionen dar, an denen eine Vorhersage erforderlich ist. Zusätzlich zu Punkt-Features kann durch Festlegen eines Wertes für den Parameter Ausgabe-Vorhersage-Raster eine vorhergesagte Oberfläche erstellt werden. Vorhersage-Features und Vorhersage-Raster müssen zusammen mit abgeglichenen erklärenden Variablen in dem gleichen Format verwendet werden, das in den Trainingsdaten verwendet wurde (Raster, Felder oder Entfernungs-Features).

  • Räumliche Ausdünnung kann dazu führen, dass die Trainingsdaten nicht alle Eingabe-Punkt-Features enthalten. Um bei Verwendung der räumlichen Ausdünnung die Performance des Modells an allen Punkten zu testen, geben Sie für die Parameter Eingabe-Punkt-Features und Eingabe-Vorhersage-Features die gleiche Feature-Class an.

  • Das Werkzeug gibt Koordinatensysteme für die Ausgaben unter Berücksichtigung des Koordinatensystems eines im Ausgabepfad verwendeten Feature-Datasets an. Andernfalls verwendet das Werkzeug das in der Umgebung Ausgabe-Koordinatensystem angegebene Koordinatensystem. Wenn Sie kein Feature-Dataset oder keine Umgebungseinstellung angeben, geht das Werkzeug für die einzelnen Ausgaben folgendermaßen vor:

    • Für die Werte der Parameter Ausgabe-Trainings-Features und Ausgabe-Trainings-Raster verwendet das Werkzeug das Koordinatensystem des Parameterwertes für Eingabe-Punkt-Features.
    • Für den Wert des Parameters Ausgabe-Vorhersage-Features verwendet das Werkzeug das Koordinatensystem des Parameterwertes für Eingabe-Vorhersage-Features.
    • Für den Wert des Parameters Ausgabe-Vorhersage-Raster verwendet das Werkzeug das Koordinatensystem, das durch den Wert des Parameters Ausgabe-Vorhersage-Features definiert wird. Wenn keine Ausgabe-Vorhersage-Features angegeben werden, verwendet das Werkzeug das Koordinatensystem des ersten im Parameter Erklärende Raster abgleichen angegebenen Rasters.

  • Die Optionen des Parameters Erweiterungen von erklärenden Variablen (Basisfunktionen) unterliegen Einschränkungen. Die Optionen Geglätteter Schritt (Hinge) und Einzelschritt (Threshold) schließen sich gegenseitig aus. Wenn eine ausgewählt ist, kann die andere nicht ausgewählt werden. Wenn eine erklärende Variable als Kategorisch festgelegt ist, wird nur die Option Original (Linear) verwendet.

  • Wenn der Parameter Resampling-Schema auf Zufällig festgelegt ist, gruppiert das Werkzeug die Daten und validiert die Performance des Modells anhand eines Subsets der gruppierten Daten. Für die einzelnen Trainingsgruppen gelten die gleichen Datenanforderungen des allgemeinen Modells: Mindestens zwei Punkte des Vorhandenseins und zwei Hintergrundpunkte sind erforderlich. Wenn diese Anforderungen nach zehn Versuchen nicht erfüllt sind, werden die Kreuzvalidierungsversuche eingestellt, und es wird eine Warnung angezeigt, aus der hervorgeht, dass die Kreuzvalidierung nicht möglich war.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Punkt-Features

Die Punkt-Features, die Positionen darstellen, an denen das Vorhandensein eines relevanten Phänomens bekannt ist.

Feature Layer
Enthält Hintergrundpunkte
(optional)

Gibt an, ob die Eingabe-Punkt-Features Hintergrundpunkte enthalten.

Wenn die Eingabe-Punkt-Features keine Hintergrundpunkte enthalten, generiert das Werkzeug mithilfe von Zellen in den erklärenden Trainings-Rastern Hintergrundpunkte. Das Werkzeug verwendet Hintergrundpunkte, um die Eigenschaften der Landschaft an unbekannten Positionen zu modellieren und sie mit Landschaftseigenschaften an bekannten Positionen des Verhaltenseins zu vergleichen. Deshalb können Hintergrundpunkte als Untersuchungsgebiet betrachtet werden. Im Allgemeinen handelt es sich bei ihnen um Positionen, an denen das Vorhandensein eines relevanten Phänomens nicht bekannt ist. Wenn jedoch Informationen zu den Hintergrundpunkten bekannt sind, kann dies mit dem Parameter Relative Gewichtung von Vorhandensein zu Hintergrund angegeben werden.

  • Aktiviert: Die Eingabe-Punkt-Features enthalten Hintergrundpunkte
  • Deaktiviert: Die Eingabe-Punkt-Features enthalten keine Hintergrundpunkte Dies ist die Standardeinstellung.
Boolean
Vorhandensein-Indikatorfeld
(optional)

Das Feld aus den Eingabe-Punkt-Features, das binäre Werte enthält, die jeden Punkt als Vorhandensein (1) oder Hintergrund (0) angeben. Das Feld muss numerisch sein.

Field
Erklärende Trainingsvariablen
(optional)

Eine Liste mit Feldern, die die erklärenden Variablen darstellen, die das Vorhersagen der Wahrscheinlichkeit für das Vorhandensein unterstützen. Sie können für jede Variable angeben, ob sie kategorisch oder numerisch ist. Aktivieren Sie das Kontrollkästchen Kategorisch für jede Variable, die eine Klasse oder Kategorie darstellt (z. B. Landbedeckung oder Anwesenheit oder Abwesenheit).

Value Table
Erklärende Trainings-Entfernungs-Features
(optional)

Eine Liste mit Feature-Layern oder Feature-Classes, die zum automatischen Erstellen erklärender Variablen verwendet werden, die die Entfernung von den Eingabe-Punkt-Features zu den nächstgelegenen angegebenen Entfernungs-Features darstellen. Wenn es sich bei den erklärenden Trainings-Entfernungs-Features der Eingabe um Polygone oder Linien handelt, werden die Entfernungsattribute als Entfernung zwischen dem nächstgelegenen Segment und dem Punkt berechnet.

Feature Layer
Erklärende Trainings-Raster
(optional)

Eine Liste mit Rastern, die zum automatischen Erstellen erklärender Trainings-Variablen im Modell verwendet werden, deren Werte aus Rastern extrahiert werden. Der Wert der Raster-Zelle wird für jedes Feature (Punkte des Vorhandenseins oder Hintergrundpunkte) in den Eingabe-Punkt-Features an der genauen Position extrahiert.

Beim Extrahieren des Raster-Werts für kontinuierliche Raster wird bilineares Resampling verwendet. Beim Extrahieren eines Raster-Werts aus Kategorie-Rastern wird ein Nächster-Nachbar-Resampling durchgeführt.

Sie können für jeden Raster-Wert angeben, ob er kategorisch oder numerisch ist. Aktivieren Sie das Kontrollkästchen Kategorisch für jedes Raster, das eine Klasse oder Kategorie darstellt (z. B. Landbedeckung).

Value Table
Erweiterungen von erklärenden Variablen (Basisfunktionen)
(optional)

Gibt die Basisfunktion an, mittels derer die angegebenen erklärenden Variablen für die Verwendung im Modell transformiert werden. Wenn mehrere Basisfunktionen ausgewählt werden, erzeugt das Werkzeug mehrere transformierte Variablen und versucht, sie im Modell zu verwenden.

  • Original (Linear)Auf die Eingabevariablen wird eine lineare Transformation angewendet. Hierbei handelt es sich um die Standardeinstellung.
  • Paarweise Interaktion (Product)Kontinuierliche erklärende Variablen werden paarweise multipliziert, um Interaktionsvariablen zu erzeugen. Diese Option ist nur verfügbar, wenn mehrere erklärende Variablen angegeben wurden.
  • Geglätteter Schritt (Hinge)Die Werte der kontinuierlichen erklärenden Variable werden in zwei Segmente konvertiert: ein statisches Segment (dessen Werte 0 oder 1 betragen) und ein Linearfunktionssegment (steigend oder abnehmend).
  • Einzelschritt (Threshold)Die Werte der kontinuierlichen erklärenden Variable werden in eine binäre Variable konvertiert, deren Werte 0 oder 1 betragen,
  • Squared (Quadratic)Zurückgegeben wird das Quadrat jedes Wertes der kontinuierlichen erklärenden Variable.
String
Anzahl von Knoten
(optional)

Die Anzahl der Knoten, die von der Hinge- und Threshold-Erweiterung der erklärenden Variable verwendet werden. Der Wert steuert die Anzahl der erstellten Schwellenwerte, die zum Erstellen mehrerer Erweiterungen erklärender Variablen anhand des jeweiligen Schwellenwertes verwendet werden. Der Wert muss zwischen 2 und 50 liegen. Die Standardeinstellung ist 10.

Long
Untersuchungsgebiet
(optional)

Gibt den Typ des Untersuchungsgebiets an, mit dem definiert wird, wo Vorhandensein möglich ist, wenn die Eingabe-Punkt-Features keine Hintergrundpunkte enthalten.

  • Konvexe HülleEs wird das kleinste konvexe Polygon verwendet, das alle Punkte des Vorhandenseins in den Eingabe-Punkt-Features enthält. Hierbei handelt es sich um die Standardeinstellung.
  • Raster-AusdehnungEs wird die Ausdehnung des Schnittpunktes der erklärenden Trainings-Raster verwendet.
  • Polygon-UntersuchungsgebietEs wird ein benutzerdefiniertes Untersuchungsgebiet verwendet, das durch eine Polygon-Feature-Class definiert wird.
String
Untersuchungsgebiet-Polygon
(optional)

Eine Feature-Class, in der die Polygone enthalten sind, die ein benutzerdefiniertes Untersuchungsgebiet definieren. Die Eingabe-Punkt-Features müssen sich in dem benutzerdefinierten Untersuchungsgebiet befindet, das durch die Polygon-Features abgedeckt ist. Ein Untersuchungsgebiet kann aus mehreren Polygonen bestehen.

Feature Layer
Räumliche Ausdünnung anwenden
(optional)

Gibt an, ob vor dem Trainieren des Modells räumliche Ausdünnung auf Punkte des Vorhandenseins und Hintergrundpunkte angewendet wird.

Durch räumliche Ausdünnung lässt sich die Stichprobenverzerrung reduzieren, indem Punkte entfernt werden und sichergestellt wird, dass die verbleibenden Punkte eine minimale Entfernung zum nächsten Nachbarn aufweisen (festgelegt im Parameter Minimale Entfernung zum nächsten Nachbarn). Die räumliche Ausdünnung wird auch auf Hintergrundpunkte angewendet, unabhängig davon, ob sie in Eingabe-Punkt-Features bereitgestellt oder vom Werkzeug generiert werden.

  • Aktiviert: Räumliche Ausdünnung wird angewendet.
  • Deaktiviert: Räumliche Ausdünnung wird nicht angewendet. Dies ist die Standardeinstellung.
Boolean
Minimale Entfernung zum nächsten Nachbarn
(optional)

Die minimale Entfernung zwischen zwei beliebigen Punkten des Vorhandenseins oder zwei beliebigen Hintergrundpunkten, wenn räumliche Ausdünnung angewendet wird.

Linear Unit
Anzahl der Iterationen für die Ausdünnung
(optional)

Die Anzahl der Ausführungen, mit der die optimale räumliche Ausdünnung erzielt wird. Dabei wird versucht, möglichst viele Punkte des Vorhandenseins und Hintergrundpunkte beizubehalten und dabei sicherzustellen, dass sich keine zwei Punkte des Vorhandenseins oder zwei Hintergrundpunkte innerhalb der mit dem Wert des Parameters Minimale Entfernung zum nächsten Nachbarn festgelegten Entfernung befinden. Die minimal mögliche Anzahl der Iterationen beträgt 1 und die maximal mögliche Anzahl 50. Die Standardeinstellung ist 10.

Dieser Parameter gilt nur für räumliche Ausdünnung, die auf Punkte des Vorhandenseins und Hintergrundpunkte in den Eingabe-Punkt-Features angewendet wird. Räumliche Ausdünnung, die auf aus Raster-Zellen generierte Hintergrundpunkte angewendet wird, wird durch Resampling der Raster-Zellen mit dem angegebenen Wert des Parameters Minimale Entfernung zum nächsten Nachbarn durchgeführt. Dabei sind für eine optimale Lösung keine Iterationen erforderlich.

Long
Relative Gewichtung von Vorhandensein zu Hintergrund
(optional)

Ein Wert zwischen 1 und 100, der die relative Gewichtung von Punkten des Vorhandenseins im Verhältnis zu Hintergrundpunkten angibt. Die Standardeinstellung ist 100.

Ein höherer Wert bedeutet, dass Punkte des Vorhandenseins die primäre Informationsquelle sind. Es ist nicht bekannt, ob Hintergrundpunkte Abwesenheit oder Fehlen darstellen, und Hintergrundpunkte erhalten im Modell eine niedrigere Gewichtung. Ein niedriger Wert bedeutet, dass Hintergrundpunkte ebenfalls wertvolle Informationen beitragen, die gemeinsam mit Informationen zu Punkten des Vorhandenseins verwendet werden können. Es besteht eine höhere Konfidenz, dass Hintergrundpunkte das Fehlen darstellen, und ihre Informationen können im Modell als Positionen des Fehlens verwendet werden.

Long
Transformation der Wahrscheinlichkeit für Vorhandensein (Kopplungsfunktion)
(optional)

Gibt die Funktion an, mit der die ungebundenen Ausgaben des Modells in eine Zahl zwischen 0 und 1 konvertiert werden. Dieser Wert kann als Wahrscheinlichkeit für das Vorhandensein an der Position interpretiert werden. Mit jeder Option wird der gleiche kontinuierliche Wert in eine jeweils andere Wahrscheinlichkeit konvertiert.

  • C-log-logMithilfe der Kopplungsfunktion "C-log-log" werden die Vorhersagen in Wahrscheinlichkeiten konvertiert. Diese Option empfiehlt sich, wenn das Vorhandensein und die Position eines Phänomens eindeutig sind. Dies ist beispielsweise der Fall, wenn das Vorhandensein einer unbeweglichen Pflanzenart modelliert wird. Dies ist die Standardeinstellung.
  • LogistischMithilfe der Kopplungsfunktion "Logistisch" werden Vorhersagen in Wahrscheinlichkeiten konvertiert. Diese Option empfiehlt sich, wenn das Vorhandensein und die Position eines Phänomens nicht eindeutig sind. Dies ist beispielsweise der Fall, wenn das Vorhandensein einer wandernden Tierart modelliert wird.
String
Grenzwert für Wahrscheinlichkeit für Vorhandensein
(optional)

Ein Grenzwert zwischen 0,01 und 0,99 legt fest, welche Wahrscheinlichkeiten in der resultierenden Klassifizierung dem Vorhandensein entsprechen. Mithilfe des Grenzwertes wird die Performance des Modells anhand von Trainingsdaten und bekannten Punkten des Vorhandenseins bewertet. In den Geoverarbeitungsmeldungen und den trainierten Ausgabe-Features werden Klassifizierungsdiagnosen bereitgestellt.

Double
Trainierte Ausgabe-Features
(optional)

Eine Ausgabe-Feature-Class, die alle Features und erklärenden Variablen enthält, die beim Trainieren des Modells verwendet werden.

Feature Class
Trainiertes Ausgabe-Raster
(optional)

Das Ausgabe-Raster mit Zellenwerten, die mithilfe der ausgewählten Verknüpfungsfunktion die Wahrscheinlichkeit des Vorhandenseins angeben. Die Standardzellengröße ist das Maximum der Zellengrößen der erklärenden Trainings-Raster. Ein trainiertes Ausgabe-Raster kann nur erstellt werden, wenn die Eingabe-Punkt-Features keine Hintergrundpunkte enthalten.

Raster Dataset
Ausgabe-Antwortkurventabelle
(optional)

Die Ausgabetabelle, die Diagnosen aus dem trainierten Modell enthält. Diese geben die Auswirkung jeder erklärenden Variable auf die Wahrscheinlichkeit des Vorhandenseins an, unter Berücksichtigung der durchschnittlichen Auswirkungen aller anderen erklärenden Variablen im Modell.

Die Tabelle enthält bis zu zwei abgeleitete Diagramme von partiellen Abhängigkeitsdiagrammen (Partial Dependence Plots, PDP): ein Satz von Liniendiagrammen für kontinuierliche Variablen und ein Satz von Balkendiagrammen für kategorische Variablen.

Table
Ausgabe-Empfindlichkeitstabelle
(optional)

Die Ausgabetabelle, die Diagnosen zur Genauigkeit des Trainingsmodells bei einer Änderung des Grenzwertes für Wahrscheinlichkeit für Vorhandensein von 0 in 1 enthält.

Table
Eingabe-Vorhersage-Features
(optional)

Die Feature-Class, die Positionen darstellt, an denen Vorhersagen getroffen werden. Die Feature-Class muss alle angegebenen Felder für erläuternde Variablen enthalten, die aus den Eingabe-Punkt-Features verwendet wurden.

Bei Verwendung von räumlicher Ausdünnung können Sie die ursprünglichen Eingabe-Punkt-Features als Eingabe-Vorhersage-Features verwenden, um eine Vorhersage für das gesamte Dataset zu erhalten.

Feature Layer
Ausgabe-Vorhersage-Features
(optional)

Die Ausgabe-Feature-Class, die die Ergebnisse des auf die Eingabe-Vorhersage-Features angewendeten Vorhersagemodells enthält.

Feature Class
Ausgabe-Vorhersage-Raster
(optional)

Das Ausgabe-Raster, das die Vorhersageergebnisse in jeder Zelle der abgeglichenen erläuternden Raster enthält. Die Standardzellengröße ist das Maximum der Zellengrößen der erklärenden Trainings-Raster.

Raster Dataset
Erklärende Variablen abgleichen
(optional)

Die überstimmenden Felder erklärender Variablen für die Eingabe-Punkt-Features und Eingabe-Vorhersage-Features.

Value Table
Entfernungs-Features abgleichen
(optional)

Die übereinstimmenden Entfernungs-Features für das Training und die Vorhersage.

Value Table
Erklärende Raster abgleichen
(optional)

Die übereinstimmenden Raster für das Training und die Vorhersage.

Value Table
Vorhersagen außerhalb von Datenbereichen zulassen
(optional)

Gibt an, ob die Vorhersage Extrapolation zulässt, wenn Werte erklärender Variablen außerhalb des beim Training verwendeten Wertebereichs liegen.

  • Aktiviert: Die Vorhersage lässt Extrapolation außerhalb des beim Training verwendeten Wertebereichs zu. Dies ist die Standardeinstellung.
  • Deaktiviert: Die Vorhersage lässt Extrapolation außerhalb des beim Training verwendeten Wertebereichs nicht zu.
Boolean
Resampling-Schema
(optional)

Gibt an, mit welcher Methode die Kreuzvalidierung des Vorhersagemodells durchgeführt wird. Bei der Kreuzvalidierung wird während des Modelltrainings ein Teil der Daten ausgeschlossen, der im Anschluss an das Training zum Testen der Modell-Performance verwendet wird.

  • KeineEs wird keine Kreuzvalidierung durchgeführt. Hierbei handelt es sich um die Standardeinstellung.
  • ZufälligDie Punkte werden nach dem Zufallsprinzip in Gruppen unterteilt, und beim Durchführen der Kreuzvalidierung wird jede Gruppe einmal ausgelassen. Die Anzahl der Gruppen wird im Parameter Gruppenanzahl angegeben.
String
Gruppenanzahl
(optional)

Die Anzahl der Gruppen, die bei der Kreuzvalidierung für das Resampling-Schema "Zufällig" verwendet werden. Ein Feld in den trainierten Ausgabe-Features gibt die Gruppe an, der der jeweilige Punkt zugewiesen wurde. Der Standardwert ist 3. Die zulässige Mindestanzahl der Gruppen beträgt 2, und es sind maximal 10 Gruppen zulässig.

Long
Trainierte Ausgabe-Modelldatei
(optional)

Eine Ausgabe-Modelldatei, in der das trainierte Modell, das später für Vorhersagen wiederverwendet werden kann, gespeichert werden soll.

File

arcpy.stats.PresenceOnlyPrediction(input_point_features, {contains_background}, {presence_indicator_field}, {explanatory_variables}, {distance_features}, {explanatory_rasters}, {basis_expansion_functions}, {number_knots}, {study_area_type}, {study_area_polygon}, {spatial_thinning}, {thinning_distance_band}, {number_of_iterations}, {relative_weight}, {link_function}, {presence_probability_cutoff}, {output_trained_features}, {output_trained_raster}, {output_response_curve_table}, {output_sensitivity_table}, {features_to_predict}, {output_pred_features}, {output_pred_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching}, {allow_predictions_outside_of_data_ranges}, {resampling_scheme}, {number_of_groups}, {output_trained_model})
NameErläuterungDatentyp
input_point_features

Die Punkt-Features, die Positionen darstellen, an denen das Vorhandensein eines relevanten Phänomens bekannt ist.

Feature Layer
contains_background
(optional)

Gibt an, ob die Eingabe-Punkt-Features Hintergrundpunkte enthalten.

Wenn die Eingabe-Punkt-Features keine Hintergrundpunkte enthalten, generiert das Werkzeug mithilfe von Zellen in den erklärenden Trainings-Rastern Hintergrundpunkte. Das Werkzeug verwendet Hintergrundpunkte, um die Eigenschaften der Landschaft an unbekannten Positionen zu modellieren und sie mit Landschaftseigenschaften an bekannten Positionen des Verhaltenseins zu vergleichen. Deshalb können Hintergrundpunkte als Untersuchungsgebiet betrachtet werden. Im Allgemeinen handelt es sich bei ihnen um Positionen, an denen das Vorhandensein eines relevanten Phänomens nicht bekannt ist. Wenn jedoch Informationen zu den Hintergrundpunkten bekannt sind, kann dies mit dem Parameter relative_weight angegeben werden.

  • PRESENCE_AND_BACKGROUND_POINTSDie Eingabe-Punkt-Features enthalten Hintergrundpunkte
  • PRESENCE_ONLY_POINTSDie Eingabe-Punkt-Features enthalten keine Hintergrundpunkte Dies ist die Standardeinstellung.
Boolean
presence_indicator_field
(optional)

Das Feld aus den Eingabe-Punkt-Features, das binäre Werte enthält, die jeden Punkt als Vorhandensein (1) oder Hintergrund (0) angeben. Das Feld muss numerisch sein.

Field
explanatory_variables
[[Variable, Categorical],...]
(optional)

Eine Liste mit Feldern, die die erklärenden Variablen darstellen, die das Vorhersagen der Wahrscheinlichkeit für das Vorhandensein unterstützen. Sie können für jede Variable angeben, ob sie kategorisch oder numerisch ist. Aktivieren Sie das Kontrollkästchen CATEGORICAL für jede Variable, die eine Klasse oder Kategorie darstellt (z. B. Landbedeckung).

Value Table
distance_features
[distance_features,...]
(optional)

Eine Liste mit Feature-Layern oder Feature-Classes, die zum automatischen Erstellen erklärender Variablen verwendet werden, die die Entfernung von den Eingabe-Punkt-Features zu den nächstgelegenen angegebenen Entfernungs-Features darstellen. Wenn es sich bei den erklärenden Trainings-Entfernungs-Features der Eingabe um Polygone oder Linien handelt, werden die Entfernungsattribute als Entfernung zwischen dem nächstgelegenen Segment und dem Punkt berechnet.

Feature Layer
explanatory_rasters
[[Variable, Categorical],...]
(optional)

Eine Liste mit Rastern, die zum automatischen Erstellen erklärender Trainings-Variablen im Modell verwendet werden, deren Werte aus Rastern extrahiert werden. Der Wert der Raster-Zelle wird für jedes Feature (Punkte des Vorhandenseins oder Hintergrundpunkte) in den Eingabe-Punkt-Features an der genauen Position extrahiert.

Beim Extrahieren des Raster-Werts für kontinuierliche Raster wird bilineares Resampling verwendet. Beim Extrahieren eines Raster-Werts aus Kategorie-Rastern wird ein Nächster-Nachbar-Resampling durchgeführt.

Sie können für jeden Raster-Wert angeben, ob er kategorisch oder numerisch ist. Aktivieren Sie das Kontrollkästchen CATEGORICAL für jedes Raster, das eine Klasse oder Kategorie darstellt (z. B. Landbedeckung).

Value Table
basis_expansion_functions
[basis_expansion_functions,...]
(optional)

Gibt die Basisfunktion an, mittels derer die angegebenen erklärenden Variablen für die Verwendung im Modell transformiert werden. Wenn mehrere Basisfunktionen ausgewählt werden, erzeugt das Werkzeug mehrere transformierte Variablen und versucht, sie im Modell zu verwenden.

  • LINEARAuf die Eingabevariablen wird eine lineare Transformation angewendet. Hierbei handelt es sich um die Standardeinstellung.
  • PRODUCTKontinuierliche erklärende Variablen werden paarweise multipliziert, um Interaktionsvariablen zu erzeugen. Diese Option ist nur verfügbar, wenn mehrere erklärende Variablen angegeben wurden.
  • HINGEDie Werte der kontinuierlichen erklärenden Variable werden in zwei Segmente konvertiert: ein statisches Segment (dessen Werte 0 oder 1 betragen) und ein Linearfunktionssegment (steigend oder abnehmend).
  • THRESHOLDDie Werte der kontinuierlichen erklärenden Variable werden in eine binäre Variable konvertiert, deren Werte 0 oder 1 betragen,
  • QUADRATICZurückgegeben wird das Quadrat jedes Wertes der kontinuierlichen erklärenden Variable.
String
number_knots
(optional)

Die Anzahl der Knoten, die von der Hinge- und Threshold-Erweiterung der erklärenden Variable verwendet werden. Der Wert steuert die Anzahl der erstellten Schwellenwerte, die zum Erstellen mehrerer Erweiterungen erklärender Variablen anhand des jeweiligen Schwellenwertes verwendet werden. Der Wert muss zwischen 2 und 50 liegen. Die Standardeinstellung ist 10.

Long
study_area_type
(optional)

Gibt den Typ des Untersuchungsgebiets an, mit dem definiert wird, wo Vorhandensein möglich ist, wenn die Eingabe-Punkt-Features keine Hintergrundpunkte enthalten.

  • CONVEX_HULLEs wird das kleinste konvexe Polygon verwendet, das alle Punkte des Vorhandenseins in den Eingabe-Punkt-Features enthält. Hierbei handelt es sich um die Standardeinstellung.
  • RASTER_EXTENTEs wird die Ausdehnung des Schnittpunktes der erklärenden Trainings-Raster verwendet.
  • STUDY_POLYGONEs wird ein benutzerdefiniertes Untersuchungsgebiet verwendet, das durch eine Polygon-Feature-Class definiert wird.
String
study_area_polygon
(optional)

Eine Feature-Class, in der die Polygone enthalten sind, die ein benutzerdefiniertes Untersuchungsgebiet definieren. Die Eingabe-Punkt-Features müssen sich in dem benutzerdefinierten Untersuchungsgebiet befindet, das durch die Polygon-Features abgedeckt ist. Ein Untersuchungsgebiet kann aus mehreren Polygonen bestehen.

Feature Layer
spatial_thinning
(optional)

Gibt an, ob vor dem Trainieren des Modells räumliche Ausdünnung auf Punkte des Vorhandenseins und Hintergrundpunkte angewendet wird.

Durch räumliche Ausdünnung lässt sich die Stichprobenverzerrung reduzieren, indem Punkte entfernt werden und sichergestellt wird, dass die verbleibenden Punkte eine minimale Entfernung zum nächsten Nachbarn aufweisen (festgelegt im Parameter thinning_distance_band). Die räumliche Ausdünnung wird auch auf Hintergrundpunkte angewendet, unabhängig davon, ob sie in Eingabe-Punkt-Features bereitgestellt oder vom Werkzeug generiert werden.

  • THINNINGRäumliche Ausdünnung wird angewendet.
  • NO_THINNINGRäumliche Ausdünnung wird nicht angewendet. Dies ist die Standardeinstellung.
Boolean
thinning_distance_band
(optional)

Die minimale Entfernung zwischen zwei beliebigen Punkten des Vorhandenseins oder zwei beliebigen Hintergrundpunkten, wenn räumliche Ausdünnung angewendet wird.

Linear Unit
number_of_iterations
(optional)

Die Anzahl der Ausführungen, mit der die optimale räumliche Ausdünnung erzielt wird. Dabei wird versucht, möglichst viele Punkte des Vorhandenseins und Hintergrundpunkte beizubehalten und dabei sicherzustellen, dass sich keine zwei Punkte des Vorhandenseins oder zwei Hintergrundpunkte innerhalb der mit dem Wert des Parameters thinning_distance_band festgelegten Entfernung befinden. Die minimal mögliche Anzahl der Iterationen beträgt 1 und die maximal mögliche Anzahl 50. Die Standardeinstellung ist 10.

Dieser Parameter gilt nur für räumliche Ausdünnung, die auf Punkte des Vorhandenseins und Hintergrundpunkte in den Eingabe-Punkt-Features angewendet wird. Räumliche Ausdünnung, die auf aus Raster-Zellen generierte Hintergrundpunkte angewendet wird, wird durch Resampling der Raster-Zellen mit dem angegebenen Wert des Parameters thinning_distance_band durchgeführt. Dabei sind für eine optimale Lösung keine Iterationen erforderlich.

Long
relative_weight
(optional)

Ein Wert zwischen 1 und 100, der die relative Gewichtung von Punkten des Vorhandenseins im Verhältnis zu Hintergrundpunkten angibt. Die Standardeinstellung ist 100.

Ein höherer Wert bedeutet, dass Punkte des Vorhandenseins die primäre Informationsquelle sind. Es ist nicht bekannt, ob Hintergrundpunkte Abwesenheit oder Fehlen darstellen, und Hintergrundpunkte erhalten im Modell eine niedrigere Gewichtung. Ein niedriger Wert bedeutet, dass Hintergrundpunkte ebenfalls wertvolle Informationen beitragen, die gemeinsam mit Informationen zu Punkten des Vorhandenseins verwendet werden können. Es besteht eine höhere Konfidenz, dass Hintergrundpunkte das Fehlen darstellen, und ihre Informationen können im Modell als Positionen des Fehlens verwendet werden.

Long
link_function
(optional)

Gibt die Funktion an, mit der die ungebundenen Ausgaben des Modells in eine Zahl zwischen 0 und 1 konvertiert werden. Dieser Wert kann als Wahrscheinlichkeit für das Vorhandensein an der Position interpretiert werden. Mit jeder Option wird der gleiche kontinuierliche Wert in eine jeweils andere Wahrscheinlichkeit konvertiert.

  • CLOGLOGMithilfe der Kopplungsfunktion "C-log-log" werden die Vorhersagen in Wahrscheinlichkeiten konvertiert. Diese Option empfiehlt sich, wenn das Vorhandensein und die Position eines Phänomens eindeutig sind. Dies ist beispielsweise der Fall, wenn das Vorhandensein einer unbeweglichen Pflanzenart modelliert wird. Dies ist die Standardeinstellung.
  • LOGISTICMithilfe der Kopplungsfunktion "Logistisch" werden Vorhersagen in Wahrscheinlichkeiten konvertiert. Diese Option empfiehlt sich, wenn das Vorhandensein und die Position eines Phänomens nicht eindeutig sind. Dies ist beispielsweise der Fall, wenn das Vorhandensein einer wandernden Tierart modelliert wird.
String
presence_probability_cutoff
(optional)

Ein Grenzwert zwischen 0,01 und 0,99 legt fest, welche Wahrscheinlichkeiten in der resultierenden Klassifizierung dem Vorhandensein entsprechen. Mithilfe des Grenzwertes wird die Performance des Modells anhand von Trainingsdaten und bekannten Punkten des Vorhandenseins bewertet. In den Geoverarbeitungsmeldungen und den trainierten Ausgabe-Features werden Klassifizierungsdiagnosen bereitgestellt.

Double
output_trained_features
(optional)

Eine Ausgabe-Feature-Class, die alle Features und erklärenden Variablen enthält, die beim Trainieren des Modells verwendet werden.

Feature Class
output_trained_raster
(optional)

Das Ausgabe-Raster mit Zellenwerten, die mithilfe der ausgewählten Verknüpfungsfunktion die Wahrscheinlichkeit des Vorhandenseins angeben. Die Standardzellengröße ist das Maximum der Zellengrößen der erklärenden Trainings-Raster. Ein trainiertes Ausgabe-Raster kann nur erstellt werden, wenn die Eingabe-Punkt-Features keine Hintergrundpunkte enthalten.

Raster Dataset
output_response_curve_table
(optional)

Die Ausgabetabelle, die Diagnosen aus dem trainierten Modell enthält. Diese geben die Auswirkung jeder erklärenden Variable auf die Wahrscheinlichkeit des Vorhandenseins an, unter Berücksichtigung der durchschnittlichen Auswirkungen aller anderen erklärenden Variablen im Modell.

Die Tabelle enthält bis zu zwei abgeleitete Diagramme von partiellen Abhängigkeitsdiagrammen (Partial Dependence Plots, PDP): ein Satz von Liniendiagrammen für kontinuierliche Variablen und ein Satz von Balkendiagrammen für kategorische Variablen.

Table
output_sensitivity_table
(optional)

Die Ausgabetabelle, die Diagnosen zur Genauigkeit des Trainingsmodells bei einer Änderung des Grenzwertes für Wahrscheinlichkeit für Vorhandensein von 0 in 1 enthält.

Table
features_to_predict
(optional)

Die Feature-Class, die Positionen darstellt, an denen Vorhersagen getroffen werden. Die Feature-Class muss alle angegebenen Felder für erläuternde Variablen enthalten, die aus den Eingabe-Punkt-Features verwendet wurden.

Bei Verwendung von räumlicher Ausdünnung können Sie die ursprünglichen Eingabe-Punkt-Features als Eingabe-Vorhersage-Features verwenden, um eine Vorhersage für das gesamte Dataset zu erhalten.

Feature Layer
output_pred_features
(optional)

Die Ausgabe-Feature-Class, die die Ergebnisse des auf die Eingabe-Vorhersage-Features angewendeten Vorhersagemodells enthält.

Feature Class
output_pred_raster
(optional)

Das Ausgabe-Raster, das die Vorhersageergebnisse in jeder Zelle der abgeglichenen erläuternden Raster enthält. Die Standardzellengröße ist das Maximum der Zellengrößen der erklärenden Trainings-Raster.

Raster Dataset
explanatory_variable_matching
[[Prediction, Training],...]
(optional)

Die überstimmenden Felder erklärender Variablen für die Eingabe-Punkt-Features und Eingabe-Vorhersage-Features.

Value Table
explanatory_distance_matching
[[Prediction, Training],...]
(optional)

Die übereinstimmenden Entfernungs-Features für das Training und die Vorhersage.

Value Table
explanatory_rasters_matching
[[Prediction, Training],...]
(optional)

Die übereinstimmenden Raster für das Training und die Vorhersage.

Value Table
allow_predictions_outside_of_data_ranges
(optional)
  • ALLOWEDDie Vorhersage lässt Extrapolation außerhalb des beim Training verwendeten Wertebereichs zu. Dies ist die Standardeinstellung.
  • NOT_ALLOWEDDie Vorhersage lässt Extrapolation außerhalb des beim Training verwendeten Wertebereichs nicht zu.
Boolean
resampling_scheme
(optional)

Gibt an, mit welcher Methode die Kreuzvalidierung des Vorhersagemodells durchgeführt wird. Bei der Kreuzvalidierung wird während des Modelltrainings ein Teil der Daten ausgeschlossen, der im Anschluss an das Training zum Testen der Modell-Performance verwendet wird.

  • NONEEs wird keine Kreuzvalidierung durchgeführt. Hierbei handelt es sich um die Standardeinstellung.
  • RANDOMDie Punkte werden nach dem Zufallsprinzip in Gruppen unterteilt, und beim Durchführen der Kreuzvalidierung wird jede Gruppe einmal ausgelassen. Die Anzahl der Gruppen wird im Parameter number_of_groups angegeben.
String
number_of_groups
(optional)

Die Anzahl der Gruppen, die bei der Kreuzvalidierung für das Resampling-Schema "Zufällig" verwendet werden. Ein Feld in den trainierten Ausgabe-Features gibt die Gruppe an, der der jeweilige Punkt zugewiesen wurde. Der Standardwert ist 3. Die zulässige Mindestanzahl der Gruppen beträgt 2, und es sind maximal 10 Gruppen zulässig.

Long
output_trained_model
(optional)

Eine Ausgabe-Modelldatei, in der das trainierte Modell, das später für Vorhersagen wiederverwendet werden kann, gespeichert werden soll.

File

Codebeispiel

PresenceOnlyPrediction: Beispiel 1 (Python-Fenster)

Das folgende Python-Skript veranschaulicht, wie die Funktion PresenceOnlyPrediction verwendet wird.


# Import system modules 
import arcpy 

# Call Presence-only Prediction (MaxEnt)
arcpy.stats.PresenceOnlyPrediction(
    input_point_features=r"C:\MyData.gdb\Presence_Points", 
    contains_background="PRESENCE_ONLY_POINTS",
    presence_indicator_field=None,
    explanatory_variables=None,
    distance_features=None,
    explanatory_rasters=[[r"C:\MyData.gdb\Elevation", "false"], 
                         [r"C:\MyData.gdb\Canopy", "false"], 
                         [r"C:\MyData.gdb\ClimacticWaterDeficit", "false"], 
                         [r"C:\MyData.gdb\LandCoverClassification", "true"], 
                         [r"C:\MyData.gdb\UpperSlope", "false"],
                         [r"C:\MyData.gdb\LowerSlope", "false"]], 
    basis_expansion_functions="LINEAR;QUADRATIC;PRODUCT;HINGE",
    number_knots=10,
    study_area_type="CONVEX_HULL",
    study_area_polygon=None,
    spatial_thinning="THINNING",
    thinning_distance_band="500 Meters", 
    number_of_iterations=10
    relative_weight=100
    link_function="CLOGLOG"
    presence_probability_cutoff=0.5
    output_trained_features=r"C:\MyData.gdb\Out_Trained_Features"
    output_trained_raster=r"C:\MyData.gdb\Out_Trained_Raster"
    output_response_curve_table=r"C:\MyData.gdb\Out_Response_Curve_Table"
    output_sensitivity_table=r"C:\MyData.gdb\Out_Sensitivity_Table"
    features_to_predict=r"C:\MyData.gdb\In_Prediction_Features"
    output_pred_features=r"C:\MyData.gdb\Out_Prediction_Features"
    output_pred_raster=r"C:\MyData.gdb\Out_Prediction_Raster",
    explanatory_variable_matching=None
    explanatory_distance_matching=None
    explanatory_rasters_matching=[[r"C:\MyData.gdb\Prediction_Elevation", "false"], 
                                  [r"C:\MyData.gdb\Prediction_Canopy", "false"], 
                                  [r"C:\MyData.gdb\Prediction_ClimacticWaterDeficit", "false"], 
                                  [r"C:\MyData.gdb\Prediction_LandCoverClassification", "true"], 
                                  [r"C:\MyData.gdb\Prediction_UpperSlope", "false"],
                                  [r"C:\MyData.gdb\Prediction_LowerSlope", "false"]], 
    allow_predictions_outside_of_data_ranges="ALLOWED"
    resampling_scheme="RANDOM"
    number_of_groups=3)
PresenceOnlyPrediction: Beispiel 2 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion PresenceOnlyPrediction verwendet wird.


# This example is a simple run of the tool using presence-only points and 
# explanatory training rasters to train an initial model. No outputs are 
# specified, as the intent is to interrogate geoprocessing messages to gain 
# an initial sense of model performance. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_ONLY_POINTS”
    
    # Set the explanatory Training variables, using only explanatory rasters
    # Note the categorical setting for the LandCoverClassification raster
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    
    # Set basis functions, adding quadratic to use the square of each variable
    basis_functions = "LINEAR;QUADRATIC"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_rasters=explanatory_rasters,
        basis_expansion_functions=basis_functions,
        study_area_type=study_area_type,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)
PresenceOnlyPrediction: Beispiel 3 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion PresenceOnlyPrediction verwendet wird.


# This example uses presence and background points and explanatory 
# variables from rasters, fields, and distance features to train a 
# model, using additional parameters to apply basis functions, use 
# spatial thinning, perform cross-validation, and receive diagnostic 
# training outputs. 

# Import system modules 
import arcpy 

try: 
    # Set the workspace and overwrite properties
    arcpy.env.workspace = r"C:\MyData.gdb" 
    arcpy.env.overwriteOutput = True 

    ### MODEL INPUTS ###
    
    # Set the input point feature parameters
    in_point_features = "presence_observations"
    contains_background = "PRESENCE_AND_BACKGROUND_POINTS
    presence_indicator_field = "Presence"
    
    # Set the explanatory Training variables
    explanatory_fields = [["Survey_Region", "true"], 
                          ["Temperature", "false"], 
                          ["Humidity", "false"]]
    explanatory_rasters = [["Elevation", "false"], 
                           ["Canopy", "false"], 
                           ["ClimacticWaterDeficit", "false"], 
                           ["LandCoverClassification", "true"], 
                           ["UpperSlope", "false"],
                           ["LowerSlope", "false"]]
    explanatory_dist_features = [["Streams", "false"], 
                                 ["Lakes", "false"], 
                                 ["Roads", "false"]]                           
    
    ### MODEL CONFIGURATION ###

    # Set basis functions
    basis_functions = "LINEAR;QUADRATIC;PRODUCT;HINGE"
    number_knots = 10

    # Set the study area
    study_area_type = "CONVEX_HULL"
    study_area_polygon = None

    # Set spatial thinning 
    spatial_thinning = "THINNING"
    min_nearest_neighbor_distance = "500 Meters"
    number_of_iterations = 10

    # Set the relative weight of presence to background and link function, using
    # background points as observed absence
    relative_weight = 1
    link_function = "LOGISTIC"

    # Set the presence probability cutoff
    cutoff = 0.3

    ### MODEL OUTPUTS AND VALIDATION ###

    # Set training outputs for model evaluation
    out_trained_features = "Out_Trained_Features"
    out_trained_raster = "Out_Trained_Raster"
    out_response_curve_table = "Out_Response_Curves"
    out_sensitivity_table = "Out_Sensitivity_Table"
    
    # Set cross-validation options
    resampling_scheme = "RANDOM"
    number_of_groups = 3

    # Call the tool using the parameters defined above.
    arcpy.stats.PresenceOnlyPrediction(
        input_point_features=in_point_features,
        contains_background=contains_background,
        explanatory_variables=explanatory_fields,
        explanatory_rasters=explanatory_rasters,
        distance_features=explanatory_dist_features,
        basis_expansion_functions=basis_functions,
        number_knots=number_knots,
        study_area_type=study_area_type,
        spatial_thinning=spatial_thinning,
        thinning_distance_band=min_nearest_neighbor_distance,
        number_of_iterations=number_of_iterations,
        relative_weight=relative_weight,
        link_function=link_function,
        presence_probability_cutoff=cutoff,
        output_trained_features=out_trained_features,
        output_trained_raster=out_trained_raster,
        output_response_curve_table=out_response_curve_table,
        output_sensitivity_table=out_sensitivity_table,
        resampling_scheme=resampling_scheme,
        number_of_groups=number_of_groups)

Umgebungen

Sonderfälle

Faktor für parallele Verarbeitung

Parallele Verarbeitung wird nur beim Treffen von Vorhersagen verwendet.

Zufallszahlengenerator

Der Zufallszahlengenerator Mersenne Twister wird verwendet.