Zestawy danych funkcji

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Zestawy danych funkcji są tworzone jako wyniki działania narzędzia Utwórz model regresji. Zestaw danych funkcji zawiera równanie i statystyki modelu regresji.

Korzystanie z zestawu danych funkcji

Zestawy danych funkcji są używane jako wejściowe modele regresji narzędzia Prognozuj zmienną. Narzędzie Prognozuj zmienną można otworzyć, przeciągając zestaw danych na kartę mapy.

Diagram punktowy prezentujący współczynniki i przedziały ufności dla tego przecięcia oraz każdej zmiennej objaśniającej można utworzyć, rozwijając zestaw danych funkcji w panelu danych i klikając opcję Wyświetl przedziały ufności.

Wskazówka:

Drag-N Drop Przeciągnij zestaw danych funkcji na diagram punktowy utworzony na podstawie innego modelu regresji w celu porównania przedziałów ufności zmiennych objaśniających między modelami.

Statystyka

Zestawy danych funkcji zawierają równanie i statystyki z modelu regresji. Aby wyświetlić statystyki, rozwiń zestaw danych funkcji w panelu danych lub otwórz tabelę danych.

W panelu danych są dostępne następujące statystyki:

StatystykaOpis

Równanie regresji

Równanie regresji ma następujący format:

y=b0+b1x1+b2x2+...+bnxn

gdzie y jest zmienną zależną, bn reprezentuje obliczone parametry, a xn reprezentuje zmienne objaśniające.

Współczynnik R2

Wartość R2 (nazywana również współczynnikiem determinacji) to liczba z zakresu od 0 do 1, która pokazuje, jak dobrze linia najlepszego dopasowania modeluje punkty danych — wartości bliższe 1 wskazują dokładniejsze modele.

Skorygowany współczynnik R2

Skorygowany współczynnik R2 również należy do zakresu od 0 do 1, ale uwzględnia więcej dodatkowych czynników prognostycznych, które mogą prowadzić do lepszego dopasowania w modelu opartym wyłącznie na prawdopodobieństwie. Dlatego wartości skorygowanego współczynnika R2 najlepiej jest użyć, jeśli w modelu jest dużo czynników prognostycznych lub podczas porównywania modeli zawierających różne liczby czynników prognostycznych.

Test Durbina-Watsona

Test Durbina-Watsona mierzy autokorelację reszt (błędów) analizy regresji w skali od 0 do 4. Na tej skali wartości z zakresu od 0 do 2 oznaczają dodatnią autokorelację, wartość 2 oznacza brak autokorelacji, a wartości z zakresu od 2 do 4 — ujemną autokorelację. Najlepsze modele regresji mają niską autokorelację, co oznacza, że korzystniejsze są wartości testu Durbina-Watsona bliskie wartości 2.

Notatka:

Obliczanie testu Durbina-Watsona zależy od porządku danych. Ważne jest, aby dane były uporządkowane sekwencyjnie, szczególnie wtedy, gdy są związane z czasem. Gdy dane nie są właściwie uporządkowane, wartość testu Durbina-Watsona może nie być dokładna.

Resztkowy błąd standardowy

Resztkowy błąd standardowy mierzy dokładność, z jaką model regresji może prognozować wartości przy zastosowaniu nowych danych. Mniejsze wartości wskazują dokładniejszy model. Wartość stopni swobody błędu resztkowego jest także podawana wraz z resztkowym błędem standardowym.

statystyka F

Statystyka F jest używana do ustalania zdolności modelu regresji do prognozowania, jeśli współczynniki są istotnie różne od zera. Statystyka F przyjmuje wartość większą lub równą 0 i zawiera dwie wartości stopni swobody: pierwsza to stopnie swobody zmiennych objaśniających, a druga to stopnie swobody błędów resztkowych.

wartość p (p-value)

Wartość p statystyki F jest testem globalnej istotności modelu regresji. Wartość p przyjmuje wartości z zakresu od 0,0 do 1,0. Wartości między 0 i 0,05 wskazują, że model globalny jest statystycznie znaczący.

W tabeli danych są dostępne następujące statystyki:

StatystykaOpis

Zmienna

Przecięcie i nazwy zmiennych objaśniających.

Współczynnik

Wartość b w równaniu regresji , która odpowiada punktowi przecięcia z osią y i pochyleniu dla poszczególnych zmiennych objaśniających.

Błąd standardowy

Błąd standardowy mierzy wariację każdego czynnika prognostycznego użytego w modelu. Mniejsze wartości wskazują dokładniejsze czynniki prognozujące.

Wartość t

Wartość t jest używana do ustalania zdolności każdego współczynnika regresji do prognozowania, jeśli współczynniki są istotnie różne od 0.

wartość p (p-value)

Wartość p jest powiązana z wartością t i testuje lokalną istotność współczynników w modelu regresji. Wartość p przyjmuje wartości z zakresu od 0,0 do 1,0. Wartości między 0,0 i 0,05 wskazują, że współczynnik jest statystycznie znaczący.

Przedział ufności

Przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik ma wartość z danego zakresu. Na przykład, jeśli dolne ograniczenie przedziału ufności 95 procent ma wartość 10, a górne ograniczenie tego przedziału ufności ma wartość 15, można mieć 95-procentową pewność, że prawdziwa wartością współczynnika wynosi między 10 i 15.

W tabeli danych są stosowane następujące przedziały ufności:

  • Dolne ograniczenie 90 procent
  • Górne ograniczenie 90 procent
  • Dolne ograniczenie 95 procent
  • Górne ograniczenie 95 procent
  • Dolne ograniczenie 99 procent
  • Górne ograniczenie 99 procent

Współczynniki standaryzowane

Współczynniki standaryzowane są obliczane poprzez standaryzowanie danych w taki sposób, aby wariancja zmiennych zależnych i objaśniających wynosiła 1. Współczynniki standaryzowane są szczególnie użyteczne w przypadku porównywania wartości współczynników o rożnych jednostkach miary.

Standaryzowane przedziały ufności

Standaryzowane przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik standaryzowany ma wartość z danego zakresu.

W tabeli danych są stosowane następujące standaryzowane przedziały ufności:

  • Dolne ograniczenie 90%
  • Górne ograniczenie 90%
  • Dolne ograniczenie 95%
  • Górne ograniczenie 95%
  • Dolne ograniczenie 99%
  • Górne ograniczenie 99%

Więcej informacji o używaniu i interpretowaniu wyników statystycznych dotyczących zestawów danych funkcji można znaleźć w temacie Analiza regresji.