Korzystanie z narzędzia Utwórz model regresji

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights Desktop

Narzędzie Utwórz model regresji służy do modelowania relacji między dwiema lub większą liczbą zmiennych objaśniających oraz zmienną odpowiedzi przez dopasowanie równania liniowego do obserwowanych danych. Każda wartość zmiennej niezależnej (x) jest powiązana z wartością zmiennej zależnej (y).

W narzędziu Utwórz model regresji stosowany jest typ regresji najmniejszych kwadratów (Ordinary Least Squares - OLS).

Przykład

Instytucja ekologiczna bada przyczyny emisji gazów cieplarnianych w różnych krajach w latach od 1990 do 2015. Za pomocą narzędzia Utwórz model regresji można utworzyć równanie, które pozwoli oszacować ilość gazów cieplarnianych emitowanych w poszczególnych krajach na podstawie zmiennych objaśniających, takich jak liczba ludności i produkt krajowy brutto.

Uruchamianie narzędzia Utwórz model regresji

Aby utworzyć model regresji, wykonaj następujące czynności:

  1. Utwórz mapę, diagram lub tabelę, korzystając z zestawu danych, dla którego ma być tworzony model regresji.
  2. Kliknij przycisk Działanie Działanie.
  3. Wykonaj jedną z następujących operacji:
    • W przypadku kart diagramów i tabel w panelu Analityka kliknij opcję Jakie występują powiązania.
    • W przypadku karty mapy kliknij kartę Znajdź odpowiedzi i kliknij opcję Jakie występują powiązania.
  4. Kliknij przycisk Utwórz model regresji.
  5. W polu Wybierz warstwę wybierz zestaw danych, dla którego ma być tworzony model regresji.
  6. W polu Wybierz zmienną zależną wybierz pole, które ma być objaśnione przy użyciu tworzonego modelu.

    Pole musi być polem typu liczbowego lub wskaźnika/współczynnika.

  7. Kliknij przycisk Wybierz zmienne objaśniające, aby wyświetlić menu z dostępnymi polami.
  8. Wybierz pola, które mają być używane jako zmienne objaśniające (nazywane także zmiennymi niezależnymi).
  9. Kliknij przycisk Wybierz, aby zastosować zmienne objaśniające.
  10. Kliknij przycisk Wizualizuj, aby wyświetlić diagram punktowy lub macierz diagramów punktowych zmiennych zależnych i objaśniających, jeśli są dostępne.
    Diagram punktowy może być używany w modelu jako część analizy eksploracyjnej.
    Notatka:

    Przycisk Wizualizuj nie jest dostępny, jeśli wybrano pięć lub większą liczbę zmiennych objaśniających.

  11. Kliknij przycisk Uruchom.

Tworzony jest model regresji dla wybranych zmiennych zależnych i objaśniających. Teraz możesz użyć danych wynikowych i statystyk do dalszego weryfikowania poprawności modelu przy użyciu analizy eksploracyjnej i potwierdzającej.

Uwagi dotyczące korzystania

Aby uzyskać dostęp do narzędzia Model regresji, kliknij przycisk Działanie Działanie w obszarze Jakie występują powiązania na karcie Znajdź odpowiedzi.

Jedno pole liczbowe lub wskaźnika/współczynnika można wybrać jako zmienną zależną. Zmienną zależną jest pole liczbowe, które staramy się objaśnić za pomocą modelu regresji. Jeśli na przykład tworzony jest model regresji, który ma określić przyczyny umieralności dzieci, zmienną zależną jest wskaźnik umieralności dzieci.

W charakterze zmiennych objaśniających można wybrać maksymalnie 20 pól liczbowych lub wskaźnika/współczynnika. Zmienne objaśniające są zmiennymi niezależnymi, które można wybrać jako część modelu regresji w celu objaśnienia zmiennej zależnej. Jeśli na przykład tworzony jest model regresji, który ma określić przyczyny umieralności dzieci, zmiennymi objaśniającymi mogą być wskaźniki ubóstwa, zachorowalności oraz szczepień. Jeśli liczba zmiennych objaśniających wynosi cztery lub mniej, można utworzyć diagram punktowy lub macierz punktową, klikając opcję Wizualizuj.

W obszarze Statystyka modelu dostępne są następujące wartości wynikowe:

  • Równanie regresji
  • Współczynnik R2
  • Skorygowany współczynnik R2
  • Test Durbina-Watsona
  • wartość p (p-value)
  • Resztkowy błąd standardowy
  • statystyka F

Za pomocą danych wynikowych i statystyk można analizować dokładność modelu.

Po utworzeniu modelu do panelu danych zostaje dodany nowy zestaw danych funkcji. Tego zestawu danych funkcji można użyć w funkcji Prognozuj zmienną. Narzędzie Utwórz model regresji tworzy również wynikowy zestaw danych zawierający wszystkie pola wejściowe oraz pola estimated, residual i standardized_residual. Pola zawierają następujące informacje:

  • estimated— wartość zmiennej zależnej oszacowana przez model regresji
  • residual— różnica między pierwotną wartością pola i oszacowaną wartością zmiennej zależnej (nazywana resztą lub błędem)
  • standardized_residual— stosunek wartości reszty (błędu) do odchylenia standardowego reszty (błędu)

Jak działa narzędzie Utwórz model regresji

Model regresji OLS można utworzyć, jeśli spełnione są następujące założenia:

  • Model musi być liniowy z punktu widzenia parametrów.
  • Dane są losową próbką z populacji.
  • Zmienne niezależne nie są mocno współliniowe.
  • Wartości zmiennych niezależnych są mierzone dokładnie, aby błąd pomiarowy można było uznać za nieistotny.
  • Wartość oczekiwana błędu zawsze wynosi zero.
  • Wariancja błędów jest stała (wariancja jednorodna).
  • Błędy mają rozkład normalny.

Działanie narzędzia Utwórz model regresji często kończy się pomyślnie, nawet jeśli nie spełniono jednego lub większej liczby założeń. Dlatego przed użyciem narzędzia Utwórz model regresji należy przetestować założenia metody najmniejszych kwadratów (OLS). Jeśli nie spełniono założeń, model może być niepoprawny.

Nie można utworzyć modelu, jeśli nie spełniono trzeciego założenia (zmienne niezależne nie są mocno współliniowe). W takiej sytuacji zostanie wyświetlony komunikat Co najmniej dwie zmienne objaśniające są powiązane Usuń jedną ze zmiennych współliniowych i ponów próbę. . Diagram punktowy lub Macierz diagramów punktowych umożliwia określanie zmiennych, które są współliniowe. Relacja między zmiennymi współliniowymi będzie liniowa, a jedna zmienna będzie silnie zależna od drugiej. Usuń z modelu zależną zmienną współliniową.

Więcej informacji na temat założeń dotyczących modeli OLS zawiera sekcja Analiza regresji.