Zestawy danych funkcji są tworzone jako wyniki działania narzędzia Utwórz model regresji. Zestaw danych funkcji zawiera równanie i statystyki modelu regresji.
Korzystanie z zestawu danych funkcji
Zestawy danych funkcji są używane jako wejściowe modele regresji narzędzia Prognozuj zmienną. Narzędzie Prognozuj zmienną można otworzyć, przeciągając zestaw danych na kartę mapy.
Można utworzyć diagram punktowy prezentujący współczynniki i przedziały ufności dla tego przecięcia oraz każdej zmiennej objaśniającej, rozwijając zestaw danych funkcji w panelu danych i klikając opcję Wyświetl przedziały ufności.
Wskazówka:
Przeciągnij zestaw danych funkcji na diagram punktowy utworzony na podstawie innego modelu regresji w celu porównania przedziałów ufności zmiennych objaśniających między modelami.
Statystyka
Zestawy danych funkcji zawierają równanie i statystyki z modelu regresji. Aby wyświetlić statystyki, rozwiń zestaw danych funkcji w panelu danych lub otwórz tabelę danych.
W panelu danych są dostępne następujące statystyki:
Statystyka | Opis |
---|---|
Równanie regresji | Równanie regresji ma następujący format:
gdzie y jest zmienną zależną, bn reprezentuje obliczone parametry, a xn reprezentuje zmienne objaśniające. |
Współczynnik R2 | Wartość R2 (nazywana również współczynnikiem determinacji) to liczba z zakresu od 0 do 1, która pokazuje, jak dobrze linia najlepszego dopasowania modeluje punkty danych — wartości bliższe 1 wskazują dokładniejsze modele. |
Skorygowany współczynnik R2 | Skorygowany współczynnik R2 również należy do zakresu od 0 do 1, ale uwzględnia dodatkowe czynniki prognostyczne, które mogą prowadzić do lepszego dopasowania w modelu opartym wyłącznie na prawdopodobieństwie. Wartości skorygowanego współczynnika R2 najlepiej jest użyć, jeśli w modelu jest dużo czynników prognostycznych lub podczas porównywania modeli zawierających różne liczby czynników prognostycznych. |
Test Durbina-Watsona | Test Durbina-Watsona mierzy autokorelację reszt (błędów) analizy regresji w skali od 0 do 4. Na tej skali wartości z zakresu od 0 do 2 oznaczają dodatnią autokorelację, wartość 2 oznacza brak autokorelacji, a wartości z zakresu od 2 do 4 — ujemną autokorelację. Najlepsze modele regresji mają niską autokorelację, co oznacza, że korzystniejsze są wartości testu Durbina-Watsona bliskie wartości 2. Notatka:Obliczanie testu Durbina-Watsona zależy od porządku danych. Ważne jest, aby dane były uporządkowane sekwencyjnie, szczególnie wtedy, gdy są związane z czasem. Gdy dane nie są właściwie uporządkowane, wartość testu Durbina-Watsona może nie być dokładna. |
Resztkowy błąd standardowy | Resztkowy błąd standardowy mierzy dokładność, z jaką model regresji może prognozować wartości przy zastosowaniu nowych danych. Mniejsze wartości wskazują dokładniejszy model. Wartość stopni swobody błędu resztkowego jest także podawana wraz z resztkowym błędem standardowym. |
statystyka F | Statystyka F jest używana do ustalania zdolności modelu regresji do prognozowania przez określenie, czy współczynniki są istotnie różne od zera. Statystyka F przyjmuje wartość większą lub równą 0 i zawiera dwie wartości stopni swobody: pierwsza to stopnie swobody zmiennych objaśniających, a druga to stopnie swobody błędów resztkowych. |
wartość p (p-value) | Wartość p statystyki F jest testem globalnej istotności modelu regresji. Wartość p przyjmuje wartości z zakresu od 0,0 do 1,0. Wartości między 0 i 0,05 wskazują, że model globalny jest statystycznie znaczący. |
W tabeli danych są dostępne następujące statystyki:
Statystyka | Opis |
---|---|
Zmienna | Przecięcie i nazwy zmiennych objaśniających. |
Współczynnik | Wartość b w równaniu regresji , która odpowiada punktowi przecięcia z osią y i pochyleniu dla poszczególnych zmiennych objaśniających. |
Błąd standardowy | Błąd standardowy mierzy wariację każdego czynnika prognostycznego użytego w modelu. Mniejsze wartości wskazują dokładniejsze czynniki prognozujące. |
Wartość t | Wartość t jest używana do ustalania zdolności każdego współczynnika regresji do prognozowania, jeśli współczynniki są istotnie różne od 0. |
wartość p (p-value) | Wartość p jest powiązana z wartością t i testuje lokalną istotność współczynników w modelu regresji. Wartość p ma wartość z zakresu od 0,0 do 1,0. Wartości między 0,0 i 0,05 wskazują, że współczynnik jest statystycznie znaczący. |
Przedział ufności | Przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik ma wartość z danego zakresu. Na przykład, jeśli dolne ograniczenie przedziału ufności 95 procent ma wartość 10, a górne ograniczenie tego przedziału ufności ma wartość 15, można mieć 95-procentową pewność, że prawdziwa wartością współczynnika wynosi między 10 i 15. W tabeli danych są stosowane następujące przedziały ufności:
|
Współczynniki standaryzowane | Współczynniki standaryzowane są obliczane poprzez standaryzowanie danych w taki sposób, aby wariancja zmiennych zależnych i objaśniających wynosiła 1. Współczynniki standaryzowane są szczególnie użyteczne w przypadku porównywania wartości współczynników o rożnych jednostkach miary. |
Standaryzowane przedziały ufności | Standaryzowane przedziały ufności narzucają górne i dolne ograniczenia, w obrębie których można mieć określony poziom pewności, że współczynnik standaryzowany ma wartość z danego zakresu. W tabeli danych są stosowane następujące standaryzowane przedziały ufności:
|
Więcej informacji o używaniu i interpretowaniu wyników statystycznych dotyczących zestawów danych funkcji można znaleźć w temacie Analiza regresji.