Jak działa narzędzie Statystyki z punktami centralnymi

Narzędzie Statystyki z punktami centralnymi wykonuje operację, która oblicza statystykę dla komórek wejściowych w zestawie nakładających się okien lub sąsiedztw. Statystyka (na przykład średnia, maksimum lub suma) jest obliczana dla wszystkich komórek wejściowych zawartych w każdym sąsiedztwie.

Przetwarzanie sąsiedztwa

Koncepcyjnie algorytm odwiedza każdą komórkę w rastrze wejściowym i oblicza statystykę dla komórek, które mieszczą się w sąsiedztwie o określonym kształcie wokół niej. Komórka, dla której obliczana jest statystyka, nazywana jest przetwarzaną komórką. Wartość przetwarzanej komórki jest zwykle uwzględniana w obliczeniach statystyki sąsiedztwa, ale w zależności od kształtu sąsiedztwa może być inaczej. Ponieważ sąsiedztwa będą się nakładać w procesie skanowania, komórki wejściowe, które są uwzględnione w obliczeniach dla jednej przetwarzanej komórki, mogą również uczestniczyć w obliczeniach dla innej przetwarzanej komórki.

Do wyboru jest kilka wstępnie zdefiniowanych kształtów sąsiedztwa. Można również utworzyć kształt niestandardowy. Statystyki, które można obliczyć dla sąsiedztwa, to większość, maksimum, średnia, mediana, minimum, mniejszość, percentyl, zakres, odchylenie standardowe, suma i zróżnicowanie.

Przykładowe obliczenia

Aby zilustrować przetwarzanie sąsiedztwa w narzędziu Statystyki z punktami centralnymi, rozważ obliczenie statystyki sumy dla sąsiedztwa wokół przetwarzanej komórki o wartości 5 na poniższym diagramie. Podany został prostokątny kształt sąsiedztwa o wymiarach 3 na 3 komórki, a parametr Ignoruj w obliczeniach Brak danych pozostaje domyślnie włączony. Suma wartości sąsiednich komórek (3 + 2 + 3 + 4 + 2 + 1 + 4 = 19) plus wartość przetwarzanej komórki (5) wynosi 24 (19 + 5 = 24). Wartość 24 jest nadawana tej komórce w rastrze wynikowym, która znajduje się w tym samym miejscu, co przetwarzana komórka w rastrze wejściowym.

Przedstawiono wartości wejściowe dla przykładowego sąsiedztwa o wymiarach 3 na 3 komórki oraz wynikową wartość sumy dla danej przetwarzanej komórki.

Powyższy diagram pokazuje, jak wykonywane są obliczenia na pojedynczej komórce w rastrze wejściowym. Na poniższym diagramie przedstawiono wyniki dla wszystkich komórek wejściowych. Komórki oznaczone na żółto identyfikują przetwarzaną komórkę i sąsiedztwo, które są używane powyższym przykładzie.

Wyświetlane są wszystkie wartości wejściowe i wynikowe operacji sumy dla punktu centralnego.

Komórki Brak danych

Parametr Ignoruj w obliczeniach Brak danych kontroluje sposób przetwarzania komórek o wartości Brak danych w oknie sąsiedztwa. Gdy ten parametr jest zaznaczony (ignore_nodata = "DATA" w środowisku Python), wszystkie komórki w sąsiedztwie, które są komórkami o wartości Brak danych, zostaną zignorowane przy obliczaniu wartości wynikowej dla przetwarzanej komórki. Jeśli jakakolwiek komórka w sąsiedztwie ma wartość Brak danych, a parametr ten jest wyłączony (ignore_nodata = "NODATA" w środowisku Python), wartość wynikowa dla przetwarzanej komórki będzie miała wartość Brak danych.

Jeśli sama przetwarzana komórka ma wartość Brak danych i włączono opcję Ignoruj w obliczeniach Brak danych, wartość wynikowa dla tej komórki zostanie obliczona na podstawie innych komórek w sąsiedztwie, które mają prawidłową wartość. Jeśli wszystkie komórki w sąsiedztwie mają wartość Brak danych, wynikiem będzie Brak danych.

Komórki narożne i brzegowe

Gdy przetwarzana komórka znajduje się w pobliżu narożników i krawędzi rastra wejściowego, liczba komórek uwzględnianych w sąsiedztwie jest odpowiednio dostosowywana. Obliczenia statystyki są również dostosowywane.

Poniższe diagramy ilustrują, w jaki sposób obliczana jest statystyka wynikowa dla każdej przetwarzanej komórki spośród dostępnych komórek w poszczególnych sąsiedztwach. Proces rozpoczyna się w lewym górnym rogu rastra wejściowego i skanuje od lewej do prawej w każdym wierszu przed przejściem do następnego wiersza. Sąsiedztwo użyte w tym przykładzie to prostokąt o wymiarach 3 na 3 komórki, a użyta statystyka to suma. Parametr Ignoruj w obliczeniach Brak danych pozostaje domyślnie włączony. Na diagramach sąsiedztwo jest zaznaczone na żółto, a przetwarzana komórka – na niebiesko.

Ponieważ pierwsza przetwarzana komórka znajduje się w lewym górnym rogu rastra wejściowego o wymiarach 6 na 6 komórek, tylko cztery komórki mogą znajdować się w jej sąsiedztwie. Dodanie tych wartości do siebie powoduje, że wartość wynikowa dla pierwszej komórki wynosi 11. W przypadku następnej komórki po prawej w sąsiedztwie znajduje się sześć komórek, dla których obliczana jest suma. Skanowanie obejmuje wszystkie komórki w pierwszym wierszu. Aby zaoszczędzić miejsce, nie pokazano wszystkich przetwarzanych komórek.

Sąsiedztwo wokół każdej przetwarzanej komórki w pierwszym wierszu komórek wejściowych jest podświetlone, wskazując, które komórki wejściowe zostaną użyte do obliczenia wartości komórki wynikowej.
Sąsiedztwo (zaznaczone na żółto) wokół każdej przetwarzanej komórki (zaznaczonej na niebiesko) wskazuje, które komórki wejściowe (u góry) zostaną użyte do obliczenia wartości statystyki wynikowej (u dołu).

Zauważ, że w pierwszym wierszu, dla trzeciej przetwarzanej komórki od lewej (wartość = 1), jedna z komórek wejściowych ma wartość Brak danych. Ponieważ narzędzie zostało ustawione tak, by ignorowało komórki Brak danych, ta konkretna komórka zostanie zignorowana w obliczeniach. Gdyby wybrano do obliczenia statystykę Średnia zamiast Suma, zostałaby obliczona suma wszystkich komórek w sąsiedztwie, które nie mają wartości Brak danych, a następnie podzielona przez 5.

W przypadku drugiego wiersza komórek wejściowych statystyka dla pierwszej przetwarzanej komórki zostanie obliczona na podstawie sześciu komórek dostępnych w sąsiedztwie. W przypadku następnej przetwarzanej komórki w obliczeniach uwzględnionych zostanie dziewięć komórek. Dla kolejnej komórki będzie osiem wartości wejściowych, ponieważ jedna z komórek w sąsiedztwie o wymiarach 3 na 3 ma wartość Brak danych. Proces ten jest kontynuowany dla pozostałych komórek w wierszu, a następnie dla kolejnych wierszy, aż do przeanalizowania wszystkich przetwarzanych komórek.

Pokazane jest przetwarzanie sąsiedztwa dla drugiego wiersza komórek wejściowych
Wskazywane jest sąsiedztwo, przetwarzana komórka i wartość wyjściowa dla części drugiego wiersza komórek wejściowych.

Wielkość sąsiedztwa a wydajność

Narzędzie może przetwarzać bardzo duże sąsiedztwa. Jednak wraz ze wzrostem rozmiaru sąsiedztwa wydajność ulega pogorszeniu, ponieważ w każdym obliczeniu uwzględnianych jest więcej komórek wejściowych. Prostokątny typ sąsiedztwa ma pewne optymalizacje, które pozwalają na zwiększenie wydajności w stosunku do innych kształtów sąsiedztwa w danym obszarze.

Maksymalny rozmiar dowolnego wymiaru sąsiedztwa jest ograniczony do 4096 komórek. Oznacza to, że prostokątne sąsiedztwa nie mogą przekroczyć tej liczby komórek w kierunku poziomym ani pionowym. W przypadku sąsiedztw kolistych promień nie może przekraczać 2047 komórek.

Typy sąsiedztwa

Sąsiedztwo może mieć kształt pierścienia (pączka), okręgu, prostokąta lub klina. Korzystając z pliku skupień, można również zdefiniować niestandardowy kształt sąsiedztwa, a także przypisywać różne wagi do określonych komórek w sąsiedztwie przed obliczeniem statystyk.

Poniżej znajdują się opisy kształtów sąsiedztwa i sposobu ich definiowania.

  • Pierścień
    • Kształt pierścienia to dwa okręgi, jeden wewnątrz drugiego, tworzące kształt pączka. Komórki, których środki znajdują się poza promieniem mniejszego okręgu, ale wewnątrz promienia większego okręgu, zostaną uwzględnione w przetwarzaniu sąsiedztwa. Obszar znajdujący się pomiędzy tymi dwoma okręgami stanowi sąsiedztwo pierścienia.
    • Promień jest określany za pomocą liczby komórek lub jednostek mapy i mierzony prostopadle do osi X lub Y. Gdy promienie są określone w jednostkach mapy, są one konwertowane na promienie w jednostkach komórki. Wynikowe promienie w jednostkach mapy tworzą obszar, który najbardziej odpowiada obszarowi obliczonemu przy użyciu oryginalnych promieni w jednostkach mapy. Każdy środek komórki objęty pierścieniem zostanie uwzględniony w przetwarzaniu sąsiedztwa.
    • Domyślne sąsiedztwo pierścienia to promień wewnętrzny o wielkości jednej komórki i promień zewnętrzny o wielkości trzech komórek.
    • Poniżej znajduje się przykładowa ilustracja sąsiedztwa w kształcie pierścienia.

    Przetwarzana komórka z domyślnym sąsiedztwem pierścieniowym
    Przetwarzana komórka z domyślnym sąsiedztwem pierścieniowym (promień wewnętrzny = 1 komórka, promień zewnętrzny = 3 komórki).

  • Okrąg
    • Sąsiedztwo w kształcie okręgu jest tworzone poprzez określenie wartości promienia.
    • Promień jest określany za pomocą liczby komórek lub jednostek mapy i mierzony prostopadle do osi X lub Y. Gdy promień jest określony w jednostkach mapy, używana jest dodatkowa logika służąca do określenia, które komórki są uwzględnione w przetwarzanym sąsiedztwie. Najpierw obliczany jest dokładny obszar okręgu zdefiniowanego przez podaną wartość promienia. Następnie obliczany jest obszar dla dwóch dodatkowych okręgów: jednego o podanej wartości promienia zaokrąglonej w dół i jednego o podanej wartości promienia zaokrąglonej w górę. Te dwa obszary są porównywane z wynikiem z określonego promienia, a w operacji zostanie użyty promień obszaru, który jest najbliższy.
    • Domyślny promień sąsiedztwa okręgu wynosi trzy komórki.
    • Poniżej znajduje się przykładowa ilustracja sąsiedztwa w kształcie okręgu.

    Przetwarzana komórka z kolistym sąsiedztwem
    Przetwarzana komórka z kolistym sąsiedztwem (promień = 2 komórki).

  • Prostokąt
    • Sąsiedztwo w kształcie prostokąta jest określane przez podanie wartości szerokości i wysokości wyrażonych w komórkach lub jednostkach mapy.
    • Tylko komórki, których środki mieszczą się w zdefiniowanym obiekcie, są przetwarzane jako część sąsiedztwa w kształcie prostokąta.
    • Domyślnym sąsiedztwem w kształcie prostokąta jest kwadrat o wysokości i szerokości trzech komórek.
    • Pozycja x,y przetwarzanej komórki w sąsiedztwie, w odniesieniu do lewego górnego rogu sąsiedztwa, jest określana przez następujące równania:

      x = (szerokość sąsiedztwa + 1)/2 y = (wysokość sąsiedztwa + 1)/2

      Jeśli wejściowa liczba komórek jest parzysta, współrzędne x,y są obliczane przy użyciu obcinania. Na przykład w sąsiedztwie o wymiarach 5 na 5 komórek wartości x i y wynoszą 3,3. W sąsiedztwie o wymiarach 4 na 4 wartości x i y wynoszą 2,2.

    • Poniżej przedstawiono przykładowe ilustracje dwóch prostokątnych sąsiedztw:

    Przetwarzana komórka z dwoma prostokątnymi sąsiedztwami
    Przetwarzana komórka z dwoma różnymi prostokątnymi sąsiedztwami.

  • Klin
    • Klin to sąsiedztwo w kształcie kawałka tortu określone przez promień, kąt początkowy i kąt końcowy.
    • Klin rozciąga się w kierunku przeciwnym do ruchu wskazówek zegara od kąta początkowego do kąta końcowego. Kąty są określane w stopniach arytmetycznych od 0 do 360, gdzie 0 znajduje się na dodatniej osi X (3:00 na zegarze) i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi. Można używać kątów ujemnych.
    • Promień jest określany za pomocą liczby komórek lub jednostek mapy i mierzony prostopadle do osi X lub Y. Gdy promień jest określony w jednostkach mapy, jest on konwertowany na promień w jednostkach komórki. Wynikowy promień w jednostkach mapy tworzy obszar, który najbardziej odpowiada obszarowi obliczonemu przy użyciu oryginalnego promienia w jednostkach mapy. Każdy środek komórki objęty klinem zostanie uwzględniony w przetwarzaniu sąsiedztwa.
    • Domyślne sąsiedztwo klina rozciąga się od 0 do 90 stopni i ma promień o wielkości trzech komórek.
    • Poniżej znajduje się przykładowa ilustracja sąsiedztwa w kształcie klina.

    Przetwarzana komórka z sąsiedztwem w kształcie klina
    Przetwarzana komórka z domyślnym sąsiedztwem w kształcie klina (promień = 3 komórki, kąt początkowy = 0, kąt końcowy = 90).

  • Nieregularny
    • Umożliwia to określenie nieregularnego sąsiedztwa wokół przetwarzanej komórki.
    • Plik skupień dla kształtu nieregularnego określa pozycje komórek, które mają zostać uwzględnione w sąsiedztwie.
    • Pozycja x,y przetwarzanej komórki w sąsiedztwie, w odniesieniu do lewego górnego rogu sąsiedztwa, jest określana przez następujące równania:

      x = (szerokość + 1)/2 y = (wysokość + 1)/2

      Jeśli wejściowa liczba komórek jest parzysta, współrzędne x i y są obliczane przy użyciu obcinania.

    • Następujące zasady dotyczą pliku skupień dla sąsiedztwa nieregularnego:

      • Plik skupień dla kształtu nieregularnego jest tekstowym plikiem ASCII, który definiuje wartości i kształt sąsiedztwa nieregularnego. Plik ten można utworzyć za pomocą dowolnego edytora zwykłego tekstu. Nazwa pliku musi mieć rozszerzenie .txt i nie może zawierać spacji.
      • Pierwszy wiersz określa szerokość i wysokość sąsiedztwa (liczba komórek w kierunku X, po której następuje spacja, oraz liczba komórek w kierunku Y).
      • Kolejne wiersze definiują wartość używaną dla każdej pozycji w sąsiedztwie, które reprezentują. Pomiędzy poszczególnymi wartościami konieczna jest spacja.
      • Wartości określają, czy pozycja w sąsiedztwie zostanie uwzględniona w obliczeniach. Zazwyczaj wartość 1 jest używana do zidentyfikowania pozycji do uwzględnienia w obliczeniach dla nieregularnego sąsiedztwa, ale można użyć dowolnej dodatniej lub ujemnej wartości innej niż 0. Można również użyć wartości zmiennoprzecinkowych.
      • Aby wykluczyć lokalizację w sąsiedztwie z obliczeń, należy użyć wartości 0 (nie pustego miejsca) w odpowiedniej lokalizacji w pliku skupień.

    • Poniższy przykład pokazuje zawartość nieregularnego pliku skupień i sąsiedztwo, które reprezentuje:

    Przykładowe nieregularne skupienie i powiązane sąsiedztwo
    Widoczne jest nieregularne skupienie sąsiedztwa wraz z ilustracją przedstawiającą to, które komórki zostaną uwzględnione w przetwarzaniu.

  • Waga
    • Podobnie jak w przypadku nieregularnego typu sąsiedztwa, sąsiedztwo typu Waga umożliwia zdefiniowanie nieregularnego sąsiedztwa wokół przetwarzanej komórki, ale pozwala również na zastosowanie wag do wartości wejściowych.
    • Plik skupień dla typu Waga określa pozycje komórek do uwzględnienia w sąsiedztwie oraz wagi, przez które będzie wykonywane mnożenie.
    • Sąsiedztwo typu Waga jest dostępne tylko dla statystyk typu średnia, odchylenie standardowe i suma.
    • Pozycja x,y przetwarzanej komórki w sąsiedztwie, w odniesieniu do lewego górnego rogu sąsiedztwa, jest określana przez następujące równania:

      x = (szerokość + 1)/2 y = (wysokość + 1)/2

      Jeśli wejściowa liczba komórek jest parzysta, współrzędne x i y są obliczane przy użyciu obcinania.

    • Następujące zasady dotyczą pliku skupień dla sąsiedztwa typu ważonego:

      • Plik skupień dla sąsiedztwa typu Waga jest tekstowym plikiem ASCII, który definiuje wartości i kształt sąsiedztwa typu Waga. Plik ten można utworzyć za pomocą dowolnego edytora zwykłego tekstu. Nazwa pliku musi mieć rozszerzenie .txt i nie może zawierać spacji.
      • Pierwszy wiersz określa szerokość i wysokość sąsiedztwa (liczba komórek w kierunku X, po której następuje spacja, oraz liczba komórek w kierunku Y).
      • Kolejne wiersze definiują wartość używaną dla każdej pozycji w sąsiedztwie, które reprezentują. Pomiędzy poszczególnymi wartościami konieczna jest spacja.
      • W przypadku statystyk typu suma waga może być dowolną wartością dodatnią, ujemną, całkowitą lub zmiennoprzecinkową.
      • W przypadku statystyk typu średnia i odchylenie standardowe waga może być dowolną dodatnią liczbą całkowitą lub wartością zmiennoprzecinkową. Wartości ujemne nie są dozwolone dla tych statystyk, więc każda pozycja z ujemną wagą zostanie zignorowana w obliczeniach.
      • Aby wykluczyć lokalizację w sąsiedztwie z obliczeń, należy użyć wartości 0 (nie pustego miejsca) w odpowiedniej lokalizacji w pliku skupień.

    • Poniższy przykład pokazuje zawartość pliku skupień wag i sąsiedztwo, które reprezentuje:

    Przykładowe ważone skupienie i powiązane sąsiedztwo
    Widoczne jest ważone skupienie sąsiedztwa wraz z ilustracją przedstawiającą to, które komórki zostaną uwzględnione w przetwarzaniu.

Typy statystyk

Dostępne są następujące statystyki: większość, maksimum, wartość średnia, mediana, minimum, mniejszość, percentyl, zakres, odchylenie standardowe, suma i zróżnicowanie. Domyślnym typem statystyki jest średnia.

Niektóre typy statystyk są dostępne tylko wtedy, gdy raster wejściowy jest typu całkowitoliczbowego.

  • Większość
    • Jako danych wejściowych można użyć tylko rastra całkowitoliczbowego.
    • Ustalana jest częstotliwość występowania każdej unikalnej wartości komórki w każdym sąsiedztwie. Jeśli istnieje pojedyncza wartość, która ma najwyższą częstotliwość (występuje najczęściej), jest ona przypisywana do wszystkich komórek w tym sąsiedztwie. W przypadku remisu przypisywana jest najniższa z równie często występujących wartości, chyba że wartość przetwarzanej komórki także występuje z tą samą częstotliwością, jak jedna z analizowanych. W takim przypadku zwracana jest oryginalna wartość przetwarzanej komórki.
  • Maksimum
    • Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
  • Średnia
    • Dane wejściowe mogą być rastrem całkowitoliczbowym lub zmiennoprzecinkowym.
    • Raster wynikowy będzie zawsze zmiennoprzecinkowy.
    • W przypadku typu sąsiedztwa typu Waga jest to jeden z obsługiwanych podzbiorów typów statystyk. Szczegółowe informacje na temat sposobu obliczania tych statystyk zawiera sekcja Sąsiedztwo typu ważonego.
  • Mediana
    • Dane wejściowe mogą być rastrem całkowitoliczbowym lub zmiennoprzecinkowym.
    • Raster wynikowy będzie zawsze zmiennoprzecinkowy.
    • Jeśli w sąsiedztwie znajduje się nieparzysta liczba prawidłowych wartości komórek, wartość mediany jest obliczana poprzez uszeregowanie wartości i wybranie wartości środkowej. Jeśli w sąsiedztwie występuje parzysta liczba wartości, zostaną one uszeregowane, a dwie środkowe wartości zostaną uśrednione.
  • Minimum
    • Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
  • Mniejszość
    • Jako danych wejściowych można użyć tylko rastra całkowitoliczbowego.
    • Ustalana jest częstotliwość występowania każdej unikalnej wartości komórki w każdym sąsiedztwie. Jeśli istnieje pojedyncza wartość, która ma najniższą częstotliwość (występuje najrzadziej), wartość ta jest przypisywana do wszystkich komórek w tym sąsiedztwie. W przypadku remisu przypisywana jest najniższa z równie często występujących wartości, chyba że wartość przetwarzanej komórki także występuje z tą samą częstotliwością, jak jedna z analizowanych. W takim przypadku zwracana jest oryginalna wartość przetwarzanej komórki.
  • Percentyl
    • Dane wejściowe mogą być rastrem całkowitoliczbowym lub zmiennoprzecinkowym.
    • Raster wynikowy będzie zawsze zmiennoprzecinkowy.
    • Wynik dla statystyki percentylowej jest obliczany na podstawie następującego wzoru (Hyndman i Fan, 1996):
      pk = (k-1)/(n-1)
  • Zakres
    • Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
    • Wartości dla każdej lokalizacji komórki w rastrze wynikowym są określane komórka po komórce przy użyciu formuły: Focal Range = Focal Maximum – Focal Minimum
  • Odchylenie standardowe
    • Raster wynikowy będzie zawsze zmiennoprzecinkowy.
    • W przypadku typu sąsiedztwa typu Waga jest to jeden z obsługiwanych podzbiorów typów statystyk. Szczegółowe informacje na temat sposobu obliczania tych statystyk zawiera sekcja Sąsiedztwo typu ważonego.
    • Odchylenie standardowe jest obliczane na całej populacji (metoda N), a nie szacowane na podstawie próbki (metoda N-1).
  • Suma
    • Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
    • W przypadku typu sąsiedztwa typu Waga jest to jeden z obsługiwanych podzbiorów typów statystyk. Szczegółowe informacje na temat sposobu obliczania tych statystyk zawiera sekcja Sąsiedztwo typu ważonego.
  • Zróżnicowanie
    • Jako danych wejściowych można użyć tylko rastra całkowitoliczbowego.

Obliczanie sąsiedztwa typu ważonego

Wielkość wpływu, jaki każda wartość w sąsiedztwie ma na ostateczny wynik dla przetwarzanej komórki, może być korygowana poprzez zastosowanie wag.

W kolejnych sekcjach przedstawiono wzory użyte do obliczenia wyników dla ważonych statystyk średniej, odchylenia standardowego i sumy. Do każdego z nich dołączony jest przykład pokazujący obliczenia dla przetwarzanej komórki oraz wyniki dla prostokątnego sąsiedztwa o wymiarach 3 na 3 komórki.

Statystyka średniej ważonej

Dla sąsiedztwa typu Waga ze statystyką Średnia, wartość wynikowa dla centralnej przetwarzanej komórki jest sumą iloczynów wartości wag skupienia i wartości wejściowych, podzieloną przez sumę wartości wag skupienia.

Wzór zastosowany do komórek w sąsiedztwie jest następujący:

Wzór na średnią ważoną

Gdzie:

  • µW jest średnią ważoną wartością populacji dla przetwarzanej komórki.
  • N jest liczbą komórek w sąsiedztwie.
  • wi jest wartością wagi zdefiniowaną w skupieniu.
  • xi jest wartością komórki wejściowej.

Wcześniejsze:

W poprzednich wersjach w obliczeniach używano liczby komórek w sąsiedztwie jako mianownika.

Wartości wag muszą być dodatnie i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi.

Przykład

Rozważmy następującą przetwarzaną komórkę o wartości 7 i osiem otaczających ją komórek sąsiadujących:

4 6 7 6 7 8 4 5 6

Średnia matematyczna (suma/liczba) tych wartości wynosi 53/9 = 5,889.

Rozważ następujące ważone skupienie komórek 3 x 3:

3 3 0,0 0,5 0,0 0,5 2,0 0,5 0,0 0,5 0,0

Skupienie to nadaje najwyższy stopień wpływu komórce centralnej (waga 2), zmniejsza wpływ czterech ortogonalnych sąsiadów przetwarzanej komórki (waga 0,5) i sprawia, że cztery komórki narożne nie mają wpływu (waga 0).

Stosując wzór na średnią ważoną podany powyżej, poniżej przedstawiono obliczenia pozwalające uzyskać ostateczną wartość.

= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) / (w1 + w2 + w3 + w4 + w5 + w6 + w7 + w8 + w9) = ((0*4)+(0.5*6)+(0*7)+(0.5*6)+(2.0*7)+(0.5*8)+(0*4)+(0.5*5)+(0*6)) / (0 + 0.5 + 0 + 0.5 + 2.0 + 0.5 + 0 + 0.5 + 0) = (0 + 3.0 + 0 + 3.0 + 14.0 + 4.0 + 0 + 2.5 + 0) / (0.5 + 0.5 + 2.0 + 0.5 + 0.5) = (3.0 + 3.0 + 14.0 + 4.0 + 2.5) / 4.0 = 26.5 / 4.0 = 6.625

Dla porównania zwykła średnia z dziewięciu komórek wejściowych wynosiłaby 5,889. Gdyby uwzględnić tylko pięć komórek wejściowych, które znajdują się w skupieniu (gdzie waga nie jest równa 0), ale bez uwzględnienia wartości wag, średnia wyniosłaby 6,4 (gdzie 6 + 6 + 7 + 8 + 5 = 32, co należy podzielić przez liczbę komórek, czyli 5).

Statystyka ważonego odchylenia standardowego

W przypadku sąsiedztwa typu Waga ze statystyką Odchylenie standardowe, wartość wynikowa dla przetwarzanej komórki jest wynikiem następującego równania:

Wzór na ważone odchylenie standardowe

Gdzie:

  • SDW jest ważoną wartością odchylenia standardowego populacji dla przetwarzanej komórki.
  • µW jest średnią ważoną wartością populacji dla przetwarzanej komórki.
  • N jest liczbą komórek w sąsiedztwie.
  • wi jest wartością wagi zdefiniowaną w skupieniu.
  • xi jest wartością komórki wejściowej.

Wartości wag muszą być dodatnie i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi.

Jeśli wszystkie wartości wejściowe w sąsiedztwie są takie same, wartość odchylenia standardowego dla tej przetwarzanej komórki wyniesie 0.

Przykład

Te same wartości sąsiedztwa, które zostały użyte w powyższym przykładzie średniej ważonej, zostaną ponownie użyte w tym przykładzie.

4 6 7 6 7 8 4 5 6

Zastosowane zostaną również te same ważone wartości skupienia:

3 3 0,0 0,5 0,0 0,5 2,0 0,5 0,0 0,5 0,0

Jeśli podane powyżej równanie ważonego odchylenia standardowego zostanie zastosowane do centralnej przetwarzanej komórki o wartości 7, obliczone ważone odchylenie standardowe wyniesie około 0,85696.

Statystyka sumy ważonej

Dla sąsiedztwa typu Waga ze statystyką Suma, wartość wynikowa dla przetwarzanej komórki jest wynikiem następującego równania:

Wzór na sumę ważoną

Gdzie:

  • SW jest ważoną wartością sumy dla przetwarzanej komórki.
  • N jest liczbą komórek w sąsiedztwie.
  • wi jest wartością wagi zdefiniowaną w skupieniu.
  • xi jest wartością komórki wejściowej.

Wartości wag mogą być dodatnie lub ujemne i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi.

Przykład

Rozważ następujące wartości wejściowe sąsiedztwa:

4 6 7 6 7 8 4 5 6

Rozważ następujące ważone skupienie komórek 3 x 3:

3 3 -1 -2 -1 0 0 0 1 2 1

Stosując powyższe równanie, poniżej przedstawiono obliczenia używane do uzyskania ostatecznej wartości:

= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) = ((-1*4) + (-2*6) + (-1*7) + (0*6) + (0*7) + (0*8) + (1*4) + (2*5) + (1*6)) = (-4) + (-12) + (-7) + 4 + 10 + 6 = -3

Odniesienia

Hyndman, R.J. i Y. Fan, listopad 1996. „Sample Quantiles in Statistical Packages”. The American Statistician 50 (4): 361-365.