Zestawy danych funkcji

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Zestawy danych funkcji są tworzone jako wyniki działania narzędzia Utwórz model regresji. Zestaw danych funkcji zawiera równanie i statystyki modelu regresji.

Korzystanie z zestawu danych funkcji

Zestawy danych funkcji są używane jako wejściowe modele regresji narzędzia Prognozuj zmienną. Narzędzie Prognozuj zmienną można otworzyć, przeciągając zestaw danych na kartę mapy.

Można utworzyć diagram punktowy prezentujący współczynniki i przedziały ufności dla tego przecięcia oraz każdej zmiennej objaśniającej, rozwijając zestaw danych funkcji w panelu danych i klikając opcję Wyświetl przedziały ufności.

Wskazówka:

Drag-N Drop Przeciągnij zestaw danych funkcji na diagram punktowy utworzony na podstawie innego modelu regresji w celu porównania przedziałów ufności zmiennych objaśniających między modelami.

Statystyka

Zestawy danych funkcji zawierają równanie i statystyki z modelu regresji. Aby wyświetlić statystyki, rozwiń zestaw danych funkcji w panelu danych lub otwórz tabelę danych.

W panelu danych są dostępne następujące statystyki:

StatystykaOpis

Równanie regresji

Równanie regresji ma następujący format:

y=b0+b1x1+b2x2+...+bnxn

gdzie y jest zmienną zależną, bn reprezentuje obliczone parametry, a xn reprezentuje zmienne objaśniające.

Współczynnik R2

Wartość R2 (nazywana również współczynnikiem determinacji) to liczba z zakresu od 0 do 1, która pokazuje, jak dobrze linia najlepszego dopasowania modeluje punkty danych — wartości bliższe 1 wskazują dokładniejsze modele.

Skorygowany współczynnik R2

Skorygowany współczynnik R2 również należy do zakresu od 0 do 1, ale uwzględnia dodatkowe czynniki prognostyczne, które mogą prowadzić do lepszego dopasowania w modelu opartym wyłącznie na prawdopodobieństwie. Wartości skorygowanego współczynnika R2 najlepiej jest użyć, jeśli w modelu jest dużo czynników prognostycznych lub podczas porównywania modeli zawierających różne liczby czynników prognostycznych.

Test Durbina-Watsona

Test Durbina-Watsona mierzy autokorelację reszt (błędów) analizy regresji w skali od 0 do 4. Na tej skali wartości z zakresu od 0 do 2 oznaczają dodatnią autokorelację, wartość 2 oznacza brak autokorelacji, a wartości z zakresu od 2 do 4 — ujemną autokorelację. Najlepsze modele regresji mają niską autokorelację, co oznacza, że korzystniejsze są wartości testu Durbina-Watsona bliskie wartości 2.

Notatka:

Obliczanie testu Durbina-Watsona zależy od porządku danych. Ważne jest, aby dane były uporządkowane sekwencyjnie, szczególnie wtedy, gdy są związane z czasem. Gdy dane nie są właściwie uporządkowane, wartość testu Durbina-Watsona może nie być dokładna.

Resztkowy błąd standardowy

Resztkowy błąd standardowy mierzy dokładność, z jaką model regresji może prognozować wartości przy zastosowaniu nowych danych. Mniejsze wartości wskazują dokładniejszy model. Wartość stopni swobody błędu resztkowego jest także podawana wraz z resztkowym błędem standardowym.

statystyka F

Statystyka F jest używana do ustalania zdolności modelu regresji do prognozowania przez określenie, czy współczynniki są istotnie różne od zera. Statystyka F przyjmuje wartość większą lub równą 0 i zawiera dwie wartości stopni swobody: pierwsza to stopnie swobody zmiennych objaśniających, a druga to stopnie swobody błędów resztkowych.

wartość p (p-value)

Wartość p statystyki F jest testem globalnej istotności modelu regresji. Wartość p przyjmuje wartości z zakresu od 0,0 do 1,0. Wartości między 0 i 0,05 wskazują, że model globalny jest statystycznie znaczący.

W tabeli danych są dostępne następujące statystyki:

StatystykaOpis

Zmienna

Przecięcie i nazwy zmiennych objaśniających.

Współczynnik

Wartość b w równaniu regresji , która odpowiada punktowi przecięcia z osią y i pochyleniu dla poszczególnych zmiennych objaśniających.

Błąd standardowy

Błąd standardowy mierzy wariację każdego czynnika prognostycznego użytego w modelu. Mniejsze wartości wskazują dokładniejsze czynniki prognozujące.

Wartość t

Wartość t jest używana do ustalania zdolności każdego współczynnika regresji do prognozowania, jeśli współczynniki są istotnie różne od 0.

wartość p (p-value)

Wartość p jest powiązana z wartością t i testuje lokalną istotność współczynników w modelu regresji. Wartość p ma wartość z zakresu od 0,0 do 1,0. Wartości między 0,0 i 0,05 wskazują, że współczynnik jest statystycznie znaczący.

Przedział ufności

Przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik ma wartość z danego zakresu. Na przykład, jeśli dolne ograniczenie przedziału ufności 95 procent ma wartość 10, a górne ograniczenie tego przedziału ufności ma wartość 15, można mieć 95-procentową pewność, że prawdziwa wartością współczynnika wynosi między 10 i 15.

W tabeli danych są stosowane następujące przedziały ufności:

  • Dolne ograniczenie 90 procent
  • Górne ograniczenie 90 procent
  • Dolne ograniczenie 95 procent
  • Górne ograniczenie 95 procent
  • Dolne ograniczenie 99 procent
  • Górne ograniczenie 99 procent

Współczynniki standaryzowane

Współczynniki standaryzowane są obliczane poprzez standaryzowanie danych w taki sposób, aby wariancja zmiennych zależnych i objaśniających wynosiła 1. Współczynniki standaryzowane są szczególnie użyteczne w przypadku porównywania wartości współczynników o rożnych jednostkach miary.

Standaryzowane przedziały ufności

Standaryzowane przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik standaryzowany ma wartość z danego zakresu.

W tabeli danych są stosowane następujące standaryzowane przedziały ufności:

  • Dolne ograniczenie 90%
  • Górne ograniczenie 90%
  • Dolne ograniczenie 95%
  • Górne ograniczenie 95%
  • Dolne ograniczenie 99%
  • Górne ograniczenie 99%

Więcej informacji o używaniu i interpretowaniu wyników statystycznych dotyczących zestawów danych funkcji można znaleźć w temacie Analiza regresji.