Funktions-Datasets

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Funktions-Datasets werden als Ausgabe von Regressionsmodell erstellen erzeugt. Ein Funktions-Dataset enthält die Gleichung und die Statistiken eines Regressionsmodells.

Verwenden eines Funktions-Datasets

Funktions-Datasets werden im Eingabe-Regressionsmodell für Variable vorhersagen verwendet. Sie können "Variable vorhersagen" öffnen, indem Sie ein Funktions-Dataset auf eine Karten-Kachel ziehen.

Ein Punktdiagramm, das die Koeffizienten und Konfidenzintervalle für den Schnittpunkt und jede erklärende Variable enthält, kann erstellt werden, indem Sie ein Funktions-Dataset im Datenbereich erweitern und auf Konfidenzintervall anzeigen klicken.

Tipp:

Drag-N Drop Ziehen Sie ein Funktions-Dataset auf das Punktdiagramm, das aus einem anderen Regressionsmodell erstellt wurde, um die Konfidenzintervalle für die erklärenden Variablen zwischen den Modellen zu vergleichen.

Statistiken

Funktions-Datasets speichern die Gleichung und die Statistiken aus einem Regressionsmodell. Statistiken können angezeigt werden, indem Sie das Funktions-Dataset im Datenbereich erweitern oder die Datentabelle öffnen.

Folgende Statistiken sind im Datenbereich verfügbar:

StatistikBeschreibung

Regressionsgleichung

Die Regressionsgleichung hat das folgende Format:

y=b0+b1x1+b2x2+...+bnxn

y ist die abhängige Variable, bn stellt die berechneten Parameter dar, und xn stellt die erklärenden Variablen dar.

R2

Der R2-Wert, auch als Bestimmtheitsmaß bezeichnet, ist eine Zahl zwischen 0 und 1, die angibt, wie gut die Datenpunkte durch die am besten passende Linie modelliert werden. Je näher die Werte bei 1 liegen, desto genauer sind die Modelle.

Adjusted R2

Adjusted R2 (adjustiertes Bestimmtheitsmaß) ist ebenfalls ein Wert zwischen 0 und 1. Mit ihm werden jedoch weitere zusätzliche Einflussvariablen berücksichtigt, die bei einem nur auf Zufall basierenden Modell möglicherweise eine bessere Anpassung bewirken. Deshalb empfiehlt es sich, den Adjusted R2-Wert zu verwenden, wenn das Modell eine große Anzahl von Einflussvariablen aufweist oder wenn Modelle verglichen werden, die eine unterschiedliche Anzahl von Einflussvariablen enthalten.

Durbin-Watson

Mit dem Durbin-Watson-Test wird die Autokorrelation von Residuen aus einer Regressionsanalyse auf einer Skala von 0 bis 4 gemessen. Dabei gibt 0 bis 2 eine positive Autokorrelation, 2 keine Autokorrelation und 2 bis 4 eine negative Autokorrelation an. Ein Regressionsmodell sollte möglichst eine geringe Autokorrelation aufweisen, d. h. die Werte des Durbin-Watson-Testes, die am nächsten bei 2 liegen, sind vorteilhafter.

Hinweis:

Die Berechnung des Durbin-Watson-Testes hängt von der Anordnung der Daten ab. Die Daten müssen sequentiell angeordnet sein, insbesondere wenn es sich um Zeitdaten handelt. Wenn die Daten nicht ordnungsgemäß angeordnet sind, ist der Wert des Durbin-Watson-Testes möglicherweise nicht korrekt.

Residualstandardfehler

Der Residualstandardfehler misst die Genauigkeit, mit der das Regressionsmodell Werte mit neuen Daten vorhersagen kann. Kleinere Werte weisen auf ein genaueres Modell hin. Mit dem Residualstandardfehler wird auch der Wert der Restfreiheitsgrade angegeben.

F-Statistik

Mit der F-Statistik wird die Vorhersagefähigkeit des Regressionsmodells bestimmt, indem festgestellt wird, ob die Koeffizienten sich deutlich von 0 unterscheiden. Die F-Statistik wird als Wert angegeben, der größer oder gleich 0 ist. Sie enthält zwei Werte für Freiheitsgrade: Der erste stellt die Freiheitsgrade für erklärende Variablen dar und der zweite die Freiheitsgrade für die Residuen.

p-Wert

Der p-Wert für die F-Statistik ist ein Test der globalen Signifikanz für das Regressionsmodell. Ein p-Wert wird als Wert zwischen 0,0 und 1,0 angegeben. Werte zwischen 0 und 0,05 weisen darauf hin, dass das globale Modell statistisch signifikant ist.

Folgende Statistiken sind in der Datentabelle verfügbar:

StatistikBeschreibung

Variable

Der Schnittpunkt und die Namen der erklärenden Variablen.

Koeffizient

Die b-Werte für die Regressionsgleichung, welche dem y-Schnittpunkt und der Neigung für jede erklärende Variable entsprechen.

Standardfehler

Der Standardfehler misst die Variation in jeder vom Modell verwendeten Einflussvariablen. Kleinere Werte weisen auf genauere Einflussvariablen hin.

t-Wert

Mit dem t-Wert wird die Vorhersagefähigkeit jedes Regressionskoeffizienten bestimmt, indem festgestellt wird, ob die Koeffizienten sich deutlich von 0 unterscheiden.

p-Wert

Der p-Wert steht in Beziehung mit dem t-Wert und prüft die lokale Signifikanz für die Koeffizienten im Regressionsmodell. Ein p-Wert wird als Wert zwischen 0,0 und 1,0 angegeben. Werte zwischen 0,0 und 0,05 weisen darauf hin, dass der Koeffizient statistisch signifikant ist.

Konfidenzintervall

Konfidenzintervalle geben die Ober- und Untergrenzen an, innerhalb derer Sie ein gewisses Maß an Sicherheit haben können, dass der Koeffizient in den Bereich fällt. Wenn z. B. das untere Konfidenzintervall von 95 Prozent 10 und das obere Konfidenzintervall von 95 Prozent 15 ist, haben Sie ein Konfidenzniveau von 95 Prozent, dass der wahre Wert des Koeffizienten zwischen 10 und 15 liegt.

In der Datentabelle werden die folgenden Konfidenzintervalle angegeben:

  • Unteres 90%-Konfidenzintervall
  • Oberes 90%-Konfidenzintervall
  • Unteres 95%-Konfidenzintervall
  • Oberes 95%-Konfidenzintervall
  • Unteres 99%-Konfidenzintervall
  • Oberes 99%-Konfidenzintervall

Standardisierte Koeffizienten

Standardisierte Koeffizienten werden berechnet, indem die Daten so standardisiert werden, dass die Varianz der abhängigen und erklärenden Variablen gleich 1 ist. Standardisierte Koeffizienten sind besonders hilfreich, um Koeffizientenwerte mit verschiedenen Maßeinheiten zu vergleichen.

Standardisierte Konfidenzintervalle

Standardisierte Konfidenzintervalle geben die Ober- und Untergrenzen an, innerhalb derer Sie ein gewisses Maß an Sicherheit haben können, dass der Koeffizient in den Bereich fällt.

In der Datentabelle werden die folgenden standardisierten Konfidenzintervalle angegeben:

  • Unteres 90%-Konfidenzintervall
  • Oberes 90%-Konfidenzintervall
  • Unteres 95%-Konfidenzintervall
  • Oberes 95%-Konfidenzintervall
  • Unteres 99 %-Konfidenzintervall
  • Oberes 99 %-Konfidenzintervall

Weitere Informationen zur Verwendung und Interpretation der statistischen Ausgaben in einem Funktions-Dataset finden Sie unter Regressionsanalyse.