Zestawy danych funkcji są tworzone jako wyniki działania narzędzia Utwórz model regresji. Zestaw danych funkcji zawiera równanie i statystyki modelu regresji.
Korzystanie z zestawu danych funkcji
Zestawy danych funkcji są używane jako wejściowe modele regresji narzędzia Prognozuj zmienną. Narzędzie Prognozuj zmienną można otworzyć, przeciągając zestaw danych na kartę mapy.
Diagram punktowy prezentujący współczynniki i przedziały ufności dla tego przecięcia oraz każdej zmiennej objaśniającej można utworzyć, rozwijając zestaw danych funkcji w panelu danych i klikając opcję Wyświetl przedziały ufności.
Wskazówka:
Przeciągnij zestaw danych funkcji na diagram punktowy utworzony na podstawie innego modelu regresji w celu porównania przedziałów ufności zmiennych objaśniających między modelami.
Statystyka
Zestawy danych funkcji zawierają równanie i statystyki z modelu regresji. Aby wyświetlić statystyki, rozwiń zestaw danych funkcji w panelu danych lub otwórz tabelę danych.
W panelu danych są dostępne następujące statystyki:
Statystyka | Opis |
---|---|
Równanie regresji | Równanie regresji ma następujący format:
gdzie y jest zmienną zależną, bn reprezentuje obliczone parametry, a xn reprezentuje zmienne objaśniające. |
Współczynnik R2 | Wartość R2 (nazywana również współczynnikiem determinacji) to liczba z zakresu od 0 do 1, która pokazuje, jak dobrze linia najlepszego dopasowania modeluje punkty danych — wartości bliższe 1 wskazują dokładniejsze modele. |
Skorygowany współczynnik R2 | Skorygowany współczynnik R2 również należy do zakresu od 0 do 1, ale uwzględnia więcej dodatkowych czynników prognostycznych, które mogą prowadzić do lepszego dopasowania w modelu opartym wyłącznie na prawdopodobieństwie. Dlatego wartości skorygowanego współczynnika R2 najlepiej jest użyć, jeśli w modelu jest dużo czynników prognostycznych lub podczas porównywania modeli zawierających różne liczby czynników prognostycznych. |
Test Durbina-Watsona | Test Durbina-Watsona mierzy autokorelację reszt (błędów) analizy regresji w skali od 0 do 4. Na tej skali wartości z zakresu od 0 do 2 oznaczają dodatnią autokorelację, wartość 2 oznacza brak autokorelacji, a wartości z zakresu od 2 do 4 — ujemną autokorelację. Najlepsze modele regresji mają niską autokorelację, co oznacza, że korzystniejsze są wartości testu Durbina-Watsona bliskie wartości 2. Notatka:Obliczanie testu Durbina-Watsona zależy od porządku danych. Ważne jest, aby dane były uporządkowane sekwencyjnie, szczególnie wtedy, gdy są związane z czasem. Gdy dane nie są właściwie uporządkowane, wartość testu Durbina-Watsona może nie być dokładna. |
Resztkowy błąd standardowy | Resztkowy błąd standardowy mierzy dokładność, z jaką model regresji może prognozować wartości przy zastosowaniu nowych danych. Mniejsze wartości wskazują dokładniejszy model. Wartość stopni swobody błędu resztkowego jest także podawana wraz z resztkowym błędem standardowym. |
statystyka F | Statystyka F jest używana do ustalania zdolności modelu regresji do prognozowania, jeśli współczynniki są istotnie różne od zera. Statystyka F przyjmuje wartość większą lub równą 0 i zawiera dwie wartości stopni swobody: pierwsza to stopnie swobody zmiennych objaśniających, a druga to stopnie swobody błędów resztkowych. |
wartość p (p-value) | Wartość p statystyki F jest testem globalnej istotności modelu regresji. Wartość p przyjmuje wartości z zakresu od 0,0 do 1,0. Wartości między 0 i 0,05 wskazują, że model globalny jest statystycznie znaczący. |
W tabeli danych są dostępne następujące statystyki:
Statystyka | Opis |
---|---|
Zmienna | Przecięcie i nazwy zmiennych objaśniających. |
Współczynnik | Wartość b w równaniu regresji , która odpowiada punktowi przecięcia z osią y i pochyleniu dla poszczególnych zmiennych objaśniających. |
Błąd standardowy | Błąd standardowy mierzy wariację każdego czynnika prognostycznego użytego w modelu. Mniejsze wartości wskazują dokładniejsze czynniki prognozujące. |
Wartość t | Wartość t jest używana do ustalania zdolności każdego współczynnika regresji do prognozowania, jeśli współczynniki są istotnie różne od 0. |
wartość p (p-value) | Wartość p jest powiązana z wartością t i testuje lokalną istotność współczynników w modelu regresji. Wartość p przyjmuje wartości z zakresu od 0,0 do 1,0. Wartości między 0,0 i 0,05 wskazują, że współczynnik jest statystycznie znaczący. |
Przedział ufności | Przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik ma wartość z danego zakresu. Na przykład, jeśli dolne ograniczenie przedziału ufności 95 procent ma wartość 10, a górne ograniczenie tego przedziału ufności ma wartość 15, można mieć 95-procentową pewność, że prawdziwa wartością współczynnika wynosi między 10 i 15. W tabeli danych są stosowane następujące przedziały ufności:
|
Współczynniki standaryzowane | Współczynniki standaryzowane są obliczane poprzez standaryzowanie danych w taki sposób, aby wariancja zmiennych zależnych i objaśniających wynosiła 1. Współczynniki standaryzowane są szczególnie użyteczne w przypadku porównywania wartości współczynników o rożnych jednostkach miary. |
Standaryzowane przedziały ufności | Standaryzowane przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik standaryzowany ma wartość z danego zakresu. W tabeli danych są stosowane następujące standaryzowane przedziały ufności:
|
Więcej informacji o używaniu i interpretowaniu wyników statystycznych dotyczących zestawów danych funkcji można znaleźć w temacie Analiza regresji.