Zestawy danych funkcji—ArcGIS Insights

Zestawy danych funkcji są tworzone jako wyniki działania narzędzia Utwórz model regresji. Zestaw danych funkcji zawiera równanie i statystyki modelu regresji.

Korzystanie z zestawu danych funkcji

Zestawy danych funkcji są używane jako wejściowe modele regresji narzędzia Prognozuj zmienną. Narzędzie Prognozuj zmienną można otworzyć, przeciągając zestaw danych na kartę mapy.

Można utworzyć diagram punktowy prezentujący współczynniki i przedziały ufności dla tego przecięcia oraz każdej zmiennej objaśniającej, rozwijając zestaw danych funkcji w panelu danych i klikając opcję Wyświetl przedziały ufności.

Wskazówka:

Drag-N Drop Przeciągnij zestaw danych funkcji na diagram punktowy utworzony na podstawie innego modelu regresji w celu porównania przedziałów ufności zmiennych objaśniających między modelami.

Statystyka

Zestawy danych funkcji zawierają równanie i statystyki z modelu regresji. Aby wyświetlić statystyki, rozwiń zestaw danych funkcji w panelu danych lub otwórz tabelę danych.

W panelu danych są dostępne następujące statystyki:


Statystyka	Opis
Równanie regresji	Równanie regresji ma następujący format: `y=b₀+b₁x₁+b₂x₂+...+b_nx_n` gdzie y jest zmienną zależną, b_n reprezentuje obliczone parametry, a x_n reprezentuje zmienne objaśniające.
Współczynnik R²	Wartość R² (nazywana również współczynnikiem determinacji) to liczba z zakresu od 0 do 1, która pokazuje, jak dobrze linia najlepszego dopasowania modeluje punkty danych — wartości bliższe 1 wskazują dokładniejsze modele.
Skorygowany współczynnik R²	Skorygowany współczynnik R² również należy do zakresu od 0 do 1, ale uwzględnia dodatkowe czynniki prognostyczne, które mogą prowadzić do lepszego dopasowania w modelu opartym wyłącznie na prawdopodobieństwie. Wartości skorygowanego współczynnika R² najlepiej jest użyć, jeśli w modelu jest dużo czynników prognostycznych lub podczas porównywania modeli zawierających różne liczby czynników prognostycznych.
Test Durbina-Watsona	Test Durbina-Watsona mierzy autokorelację reszt (błędów) analizy regresji w skali od 0 do 4. Na tej skali wartości z zakresu od 0 do 2 oznaczają dodatnią autokorelację, wartość 2 oznacza brak autokorelacji, a wartości z zakresu od 2 do 4 — ujemną autokorelację. Najlepsze modele regresji mają niską autokorelację, co oznacza, że korzystniejsze są wartości testu Durbina-Watsona bliskie wartości 2. Notatka: Obliczanie testu Durbina-Watsona zależy od porządku danych. Ważne jest, aby dane były uporządkowane sekwencyjnie, szczególnie wtedy, gdy są związane z czasem. Gdy dane nie są właściwie uporządkowane, wartość testu Durbina-Watsona może nie być dokładna.
Resztkowy błąd standardowy	Resztkowy błąd standardowy mierzy dokładność, z jaką model regresji może prognozować wartości przy zastosowaniu nowych danych. Mniejsze wartości wskazują dokładniejszy model. Wartość stopni swobody błędu resztkowego jest także podawana wraz z resztkowym błędem standardowym.
statystyka F	Statystyka F jest używana do ustalania zdolności modelu regresji do prognozowania przez określenie, czy współczynniki są istotnie różne od zera. Statystyka F przyjmuje wartość większą lub równą 0 i zawiera dwie wartości stopni swobody: pierwsza to stopnie swobody zmiennych objaśniających, a druga to stopnie swobody błędów resztkowych.
wartość p (p-value)	Wartość p statystyki F jest testem globalnej istotności modelu regresji. Wartość p przyjmuje wartości z zakresu od 0,0 do 1,0. Wartości między 0 i 0,05 wskazują, że model globalny jest statystycznie znaczący.

W tabeli danych są dostępne następujące statystyki:


Statystyka	Opis
Zmienna	Przecięcie i nazwy zmiennych objaśniających.
Współczynnik	Wartość b w równaniu regresji , która odpowiada punktowi przecięcia z osią y i pochyleniu dla poszczególnych zmiennych objaśniających.
Błąd standardowy	Błąd standardowy mierzy wariację każdego czynnika prognostycznego użytego w modelu. Mniejsze wartości wskazują dokładniejsze czynniki prognozujące.
Wartość t	Wartość t jest używana do ustalania zdolności każdego współczynnika regresji do prognozowania, jeśli współczynniki są istotnie różne od 0.
wartość p (p-value)	Wartość p jest powiązana z wartością t i testuje lokalną istotność współczynników w modelu regresji. Wartość p ma wartość z zakresu od 0,0 do 1,0. Wartości między 0,0 i 0,05 wskazują, że współczynnik jest statystycznie znaczący.
Przedział ufności	Przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik ma wartość z danego zakresu. Na przykład, jeśli dolne ograniczenie przedziału ufności 95 procent ma wartość 10, a górne ograniczenie tego przedziału ufności ma wartość 15, można mieć 95-procentową pewność, że prawdziwa wartością współczynnika wynosi między 10 i 15. W tabeli danych są stosowane następujące przedziały ufności: Dolne ograniczenie 90 procent Górne ograniczenie 90 procent Dolne ograniczenie 95 procent Górne ograniczenie 95 procent Dolne ograniczenie 99 procent Górne ograniczenie 99 procent
Współczynniki standaryzowane	Współczynniki standaryzowane są obliczane poprzez standaryzowanie danych w taki sposób, aby wariancja zmiennych zależnych i objaśniających wynosiła 1. Współczynniki standaryzowane są szczególnie użyteczne w przypadku porównywania wartości współczynników o rożnych jednostkach miary.
Standaryzowane przedziały ufności	Standaryzowane przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik standaryzowany ma wartość z danego zakresu. W tabeli danych są stosowane następujące standaryzowane przedziały ufności: Dolne ograniczenie 90% Górne ograniczenie 90% Dolne ograniczenie 95% Górne ograniczenie 95% Dolne ograniczenie 99% Górne ograniczenie 99%

Więcej informacji o używaniu i interpretowaniu wyników statystycznych dotyczących zestawów danych funkcji można znaleźć w temacie Analiza regresji.

Opinia na ten temat?

Korzystanie z zestawu danych funkcji

Wskazówka:

Statystyka

Notatka:

W tym temacie