Narzędzie Statystyki z punktami centralnymi wykonuje operację, która oblicza statystykę dla komórek wejściowych w zestawie nakładających się okien lub sąsiedztw. Statystyka (na przykład średnia, maksimum lub suma) jest obliczana dla wszystkich komórek wejściowych zawartych w każdym sąsiedztwie.
Przetwarzanie sąsiedztwa
Koncepcyjnie algorytm odwiedza każdą komórkę w rastrze wejściowym i oblicza statystykę dla komórek, które mieszczą się w sąsiedztwie o określonym kształcie wokół niej. Komórka, dla której obliczana jest statystyka, nazywana jest przetwarzaną komórką. Wartość przetwarzanej komórki jest zwykle uwzględniana w obliczeniach statystyki sąsiedztwa, ale w zależności od kształtu sąsiedztwa może być inaczej. Ponieważ sąsiedztwa będą się nakładać w procesie skanowania, komórki wejściowe, które są uwzględnione w obliczeniach dla jednej przetwarzanej komórki, mogą również uczestniczyć w obliczeniach dla innej przetwarzanej komórki.
Do wyboru jest kilka wstępnie zdefiniowanych kształtów sąsiedztwa. Można również utworzyć kształt niestandardowy. Statystyki, które można obliczyć dla sąsiedztwa, to większość, maksimum, średnia, mediana, minimum, mniejszość, percentyl, zakres, odchylenie standardowe, suma i zróżnicowanie.
Przykładowe obliczenia
Aby zilustrować przetwarzanie sąsiedztwa w narzędziu Statystyki z punktami centralnymi, rozważ obliczenie statystyki sumy dla sąsiedztwa wokół przetwarzanej komórki o wartości 5 na poniższym diagramie. Podany został prostokątny kształt sąsiedztwa o wymiarach 3 na 3 komórki, a parametr Ignoruj w obliczeniach Brak danych pozostaje domyślnie włączony. Suma wartości sąsiednich komórek (3 + 2 + 3 + 4 + 2 + 1 + 4 = 19) plus wartość przetwarzanej komórki (5) wynosi 24 (19 + 5 = 24). Wartość 24 jest nadawana tej komórce w rastrze wynikowym, która znajduje się w tym samym miejscu, co przetwarzana komórka w rastrze wejściowym.
Powyższy diagram pokazuje, jak wykonywane są obliczenia na pojedynczej komórce w rastrze wejściowym. Na poniższym diagramie przedstawiono wyniki dla wszystkich komórek wejściowych. Komórki oznaczone na żółto identyfikują przetwarzaną komórkę i sąsiedztwo, które są używane powyższym przykładzie.
Komórki Brak danych
Parametr Ignoruj w obliczeniach Brak danych kontroluje sposób przetwarzania komórek o wartości Brak danych w oknie sąsiedztwa. Gdy ten parametr jest zaznaczony (ignore_nodata = "DATA" w środowisku Python), wszystkie komórki w sąsiedztwie, które są komórkami o wartości Brak danych, zostaną zignorowane przy obliczaniu wartości wynikowej dla przetwarzanej komórki. Jeśli jakakolwiek komórka w sąsiedztwie ma wartość Brak danych, a parametr ten jest wyłączony (ignore_nodata = "NODATA" w środowisku Python), wartość wynikowa dla przetwarzanej komórki będzie miała wartość Brak danych.
Jeśli sama przetwarzana komórka ma wartość Brak danych i włączono opcję Ignoruj w obliczeniach Brak danych, wartość wynikowa dla tej komórki zostanie obliczona na podstawie innych komórek w sąsiedztwie, które mają prawidłową wartość. Jeśli wszystkie komórki w sąsiedztwie mają wartość Brak danych, wynikiem będzie Brak danych.
Komórki narożne i brzegowe
Gdy przetwarzana komórka znajduje się w pobliżu narożników i krawędzi rastra wejściowego, liczba komórek uwzględnianych w sąsiedztwie jest odpowiednio dostosowywana. Obliczenia statystyki są również dostosowywane.
Poniższe diagramy ilustrują, w jaki sposób obliczana jest statystyka wynikowa dla każdej przetwarzanej komórki spośród dostępnych komórek w poszczególnych sąsiedztwach. Proces rozpoczyna się w lewym górnym rogu rastra wejściowego i skanuje od lewej do prawej w każdym wierszu przed przejściem do następnego wiersza. Sąsiedztwo użyte w tym przykładzie to prostokąt o wymiarach 3 na 3 komórki, a użyta statystyka to suma. Parametr Ignoruj w obliczeniach Brak danych pozostaje domyślnie włączony. Na diagramach sąsiedztwo jest zaznaczone na żółto, a przetwarzana komórka – na niebiesko.
Ponieważ pierwsza przetwarzana komórka znajduje się w lewym górnym rogu rastra wejściowego o wymiarach 6 na 6 komórek, tylko cztery komórki mogą znajdować się w jej sąsiedztwie. Dodanie tych wartości do siebie powoduje, że wartość wynikowa dla pierwszej komórki wynosi 11. W przypadku następnej komórki po prawej w sąsiedztwie znajduje się sześć komórek, dla których obliczana jest suma. Skanowanie obejmuje wszystkie komórki w pierwszym wierszu. Aby zaoszczędzić miejsce, nie pokazano wszystkich przetwarzanych komórek.
Zauważ, że w pierwszym wierszu, dla trzeciej przetwarzanej komórki od lewej (wartość = 1), jedna z komórek wejściowych ma wartość Brak danych. Ponieważ narzędzie zostało ustawione tak, by ignorowało komórki Brak danych, ta konkretna komórka zostanie zignorowana w obliczeniach. Gdyby wybrano do obliczenia statystykę Średnia zamiast Suma, zostałaby obliczona suma wszystkich komórek w sąsiedztwie, które nie mają wartości Brak danych, a następnie podzielona przez 5.
W przypadku drugiego wiersza komórek wejściowych statystyka dla pierwszej przetwarzanej komórki zostanie obliczona na podstawie sześciu komórek dostępnych w sąsiedztwie. W przypadku następnej przetwarzanej komórki w obliczeniach uwzględnionych zostanie dziewięć komórek. Dla kolejnej komórki będzie osiem wartości wejściowych, ponieważ jedna z komórek w sąsiedztwie o wymiarach 3 na 3 ma wartość Brak danych. Proces ten jest kontynuowany dla pozostałych komórek w wierszu, a następnie dla kolejnych wierszy, aż do przeanalizowania wszystkich przetwarzanych komórek.
Wielkość sąsiedztwa a wydajność
Narzędzie może przetwarzać bardzo duże sąsiedztwa. Jednak wraz ze wzrostem rozmiaru sąsiedztwa wydajność ulega pogorszeniu, ponieważ w każdym obliczeniu uwzględnianych jest więcej komórek wejściowych. Prostokątny typ sąsiedztwa ma pewne optymalizacje, które pozwalają na zwiększenie wydajności w stosunku do innych kształtów sąsiedztwa w danym obszarze.
Maksymalny rozmiar dowolnego wymiaru sąsiedztwa jest ograniczony do 4096 komórek. Oznacza to, że prostokątne sąsiedztwa nie mogą przekroczyć tej liczby komórek w kierunku poziomym ani pionowym. W przypadku sąsiedztw kolistych promień nie może przekraczać 2047 komórek.
Typy sąsiedztwa
Sąsiedztwo może mieć kształt pierścienia (pączka), okręgu, prostokąta lub klina. Korzystając z pliku skupień, można również zdefiniować niestandardowy kształt sąsiedztwa, a także przypisywać różne wagi do określonych komórek w sąsiedztwie przed obliczeniem statystyk.
Poniżej znajdują się opisy kształtów sąsiedztwa i sposobu ich definiowania.
- Pierścień
- Kształt pierścienia to dwa okręgi, jeden wewnątrz drugiego, tworzące kształt pączka. Komórki, których środki znajdują się poza promieniem mniejszego okręgu, ale wewnątrz promienia większego okręgu, zostaną uwzględnione w przetwarzaniu sąsiedztwa. Obszar znajdujący się pomiędzy tymi dwoma okręgami stanowi sąsiedztwo pierścienia.
- Promień jest określany za pomocą liczby komórek lub jednostek mapy i mierzony prostopadle do osi X lub Y. Gdy promienie są określone w jednostkach mapy, są one konwertowane na promienie w jednostkach komórki. Wynikowe promienie w jednostkach mapy tworzą obszar, który najbardziej odpowiada obszarowi obliczonemu przy użyciu oryginalnych promieni w jednostkach mapy. Każdy środek komórki objęty pierścieniem zostanie uwzględniony w przetwarzaniu sąsiedztwa.
- Domyślne sąsiedztwo pierścienia to promień wewnętrzny o wielkości jednej komórki i promień zewnętrzny o wielkości trzech komórek.
- Poniżej znajduje się przykładowa ilustracja sąsiedztwa w kształcie pierścienia.
- Okrąg
- Sąsiedztwo w kształcie okręgu jest tworzone poprzez określenie wartości promienia.
- Promień jest określany za pomocą liczby komórek lub jednostek mapy i mierzony prostopadle do osi X lub Y. Gdy promień jest określony w jednostkach mapy, używana jest dodatkowa logika służąca do określenia, które komórki są uwzględnione w przetwarzanym sąsiedztwie. Najpierw obliczany jest dokładny obszar okręgu zdefiniowanego przez podaną wartość promienia. Następnie obliczany jest obszar dla dwóch dodatkowych okręgów: jednego o podanej wartości promienia zaokrąglonej w dół i jednego o podanej wartości promienia zaokrąglonej w górę. Te dwa obszary są porównywane z wynikiem z określonego promienia, a w operacji zostanie użyty promień obszaru, który jest najbliższy.
- Domyślny promień sąsiedztwa okręgu wynosi trzy komórki.
- Poniżej znajduje się przykładowa ilustracja sąsiedztwa w kształcie okręgu.
- Prostokąt
- Sąsiedztwo w kształcie prostokąta jest określane przez podanie wartości szerokości i wysokości wyrażonych w komórkach lub jednostkach mapy.
- Tylko komórki, których środki mieszczą się w zdefiniowanym obiekcie, są przetwarzane jako część sąsiedztwa w kształcie prostokąta.
- Domyślnym sąsiedztwem w kształcie prostokąta jest kwadrat o wysokości i szerokości trzech komórek.
- Pozycja x,y przetwarzanej komórki w sąsiedztwie, w odniesieniu do lewego górnego rogu sąsiedztwa, jest określana przez następujące równania:
x = (szerokość sąsiedztwa + 1)/2 y = (wysokość sąsiedztwa + 1)/2
Jeśli wejściowa liczba komórek jest parzysta, współrzędne x,y są obliczane przy użyciu obcinania. Na przykład w sąsiedztwie o wymiarach 5 na 5 komórek wartości x i y wynoszą 3,3. W sąsiedztwie o wymiarach 4 na 4 wartości x i y wynoszą 2,2.
- Poniżej przedstawiono przykładowe ilustracje dwóch prostokątnych sąsiedztw:
- Klin
- Klin to sąsiedztwo w kształcie kawałka tortu określone przez promień, kąt początkowy i kąt końcowy.
- Klin rozciąga się w kierunku przeciwnym do ruchu wskazówek zegara od kąta początkowego do kąta końcowego. Kąty są określane w stopniach arytmetycznych od 0 do 360, gdzie 0 znajduje się na dodatniej osi X (3:00 na zegarze) i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi. Można używać kątów ujemnych.
- Promień jest określany za pomocą liczby komórek lub jednostek mapy i mierzony prostopadle do osi X lub Y. Gdy promień jest określony w jednostkach mapy, jest on konwertowany na promień w jednostkach komórki. Wynikowy promień w jednostkach mapy tworzy obszar, który najbardziej odpowiada obszarowi obliczonemu przy użyciu oryginalnego promienia w jednostkach mapy. Każdy środek komórki objęty klinem zostanie uwzględniony w przetwarzaniu sąsiedztwa.
- Domyślne sąsiedztwo klina rozciąga się od 0 do 90 stopni i ma promień o wielkości trzech komórek.
- Poniżej znajduje się przykładowa ilustracja sąsiedztwa w kształcie klina.
- Nieregularny
- Umożliwia to określenie nieregularnego sąsiedztwa wokół przetwarzanej komórki.
- Plik skupień dla kształtu nieregularnego określa pozycje komórek, które mają zostać uwzględnione w sąsiedztwie.
- Pozycja x,y przetwarzanej komórki w sąsiedztwie, w odniesieniu do lewego górnego rogu sąsiedztwa, jest określana przez następujące równania:
x = (szerokość + 1)/2 y = (wysokość + 1)/2
Jeśli wejściowa liczba komórek jest parzysta, współrzędne x i y są obliczane przy użyciu obcinania.
- Następujące zasady dotyczą pliku skupień dla sąsiedztwa nieregularnego:
- Plik skupień dla kształtu nieregularnego jest tekstowym plikiem ASCII, który definiuje wartości i kształt sąsiedztwa nieregularnego. Plik ten można utworzyć za pomocą dowolnego edytora zwykłego tekstu. Nazwa pliku musi mieć rozszerzenie .txt i nie może zawierać spacji.
- Pierwszy wiersz określa szerokość i wysokość sąsiedztwa (liczba komórek w kierunku X, po której następuje spacja, oraz liczba komórek w kierunku Y).
- Kolejne wiersze definiują wartość używaną dla każdej pozycji w sąsiedztwie, które reprezentują. Pomiędzy poszczególnymi wartościami konieczna jest spacja.
- Wartości określają, czy pozycja w sąsiedztwie zostanie uwzględniona w obliczeniach. Zazwyczaj wartość 1 jest używana do zidentyfikowania pozycji do uwzględnienia w obliczeniach dla nieregularnego sąsiedztwa, ale można użyć dowolnej dodatniej lub ujemnej wartości innej niż 0. Można również użyć wartości zmiennoprzecinkowych.
- Aby wykluczyć lokalizację w sąsiedztwie z obliczeń, należy użyć wartości 0 (nie pustego miejsca) w odpowiedniej lokalizacji w pliku skupień.
- Poniższy przykład pokazuje zawartość nieregularnego pliku skupień i sąsiedztwo, które reprezentuje:
- Waga
- Podobnie jak w przypadku nieregularnego typu sąsiedztwa, sąsiedztwo typu Waga umożliwia zdefiniowanie nieregularnego sąsiedztwa wokół przetwarzanej komórki, ale pozwala również na zastosowanie wag do wartości wejściowych.
- Plik skupień dla typu Waga określa pozycje komórek do uwzględnienia w sąsiedztwie oraz wagi, przez które będzie wykonywane mnożenie.
- Sąsiedztwo typu Waga jest dostępne tylko dla statystyk typu średnia, odchylenie standardowe i suma.
- Pozycja x,y przetwarzanej komórki w sąsiedztwie, w odniesieniu do lewego górnego rogu sąsiedztwa, jest określana przez następujące równania:
x = (szerokość + 1)/2 y = (wysokość + 1)/2
Jeśli wejściowa liczba komórek jest parzysta, współrzędne x i y są obliczane przy użyciu obcinania.
- Następujące zasady dotyczą pliku skupień dla sąsiedztwa typu ważonego:
- Plik skupień dla sąsiedztwa typu Waga jest tekstowym plikiem ASCII, który definiuje wartości i kształt sąsiedztwa typu Waga. Plik ten można utworzyć za pomocą dowolnego edytora zwykłego tekstu. Nazwa pliku musi mieć rozszerzenie .txt i nie może zawierać spacji.
- Pierwszy wiersz określa szerokość i wysokość sąsiedztwa (liczba komórek w kierunku X, po której następuje spacja, oraz liczba komórek w kierunku Y).
- Kolejne wiersze definiują wartość używaną dla każdej pozycji w sąsiedztwie, które reprezentują. Pomiędzy poszczególnymi wartościami konieczna jest spacja.
- W przypadku statystyk typu suma waga może być dowolną wartością dodatnią, ujemną, całkowitą lub zmiennoprzecinkową.
- W przypadku statystyk typu średnia i odchylenie standardowe waga może być dowolną dodatnią liczbą całkowitą lub wartością zmiennoprzecinkową. Wartości ujemne nie są dozwolone dla tych statystyk, więc każda pozycja z ujemną wagą zostanie zignorowana w obliczeniach.
- Aby wykluczyć lokalizację w sąsiedztwie z obliczeń, należy użyć wartości 0 (nie pustego miejsca) w odpowiedniej lokalizacji w pliku skupień.
- Poniższy przykład pokazuje zawartość pliku skupień wag i sąsiedztwo, które reprezentuje:
Typy statystyk
Dostępne są następujące statystyki: większość, maksimum, wartość średnia, mediana, minimum, mniejszość, percentyl, zakres, odchylenie standardowe, suma i zróżnicowanie. Domyślnym typem statystyki jest średnia.
Niektóre typy statystyk są dostępne tylko wtedy, gdy raster wejściowy jest typu całkowitoliczbowego.
- Większość
- Jako danych wejściowych można użyć tylko rastra całkowitoliczbowego.
- Ustalana jest częstotliwość występowania każdej unikalnej wartości komórki w każdym sąsiedztwie. Jeśli istnieje pojedyncza wartość, która ma najwyższą częstotliwość (występuje najczęściej), jest ona przypisywana do wszystkich komórek w tym sąsiedztwie. W przypadku remisu przypisywana jest najniższa z równie często występujących wartości, chyba że wartość przetwarzanej komórki także występuje z tą samą częstotliwością, jak jedna z analizowanych. W takim przypadku zwracana jest oryginalna wartość przetwarzanej komórki.
- Maksimum
- Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
- Średnia
- Dane wejściowe mogą być rastrem całkowitoliczbowym lub zmiennoprzecinkowym.
- Raster wynikowy będzie zawsze zmiennoprzecinkowy.
- W przypadku typu sąsiedztwa typu Waga jest to jeden z obsługiwanych podzbiorów typów statystyk. Szczegółowe informacje na temat sposobu obliczania tych statystyk zawiera sekcja Sąsiedztwo typu ważonego.
- Mediana
- Dane wejściowe mogą być rastrem całkowitoliczbowym lub zmiennoprzecinkowym.
- Raster wynikowy będzie zawsze zmiennoprzecinkowy.
- Jeśli w sąsiedztwie znajduje się nieparzysta liczba prawidłowych wartości komórek, wartość mediany jest obliczana poprzez uszeregowanie wartości i wybranie wartości środkowej. Jeśli w sąsiedztwie występuje parzysta liczba wartości, zostaną one uszeregowane, a dwie środkowe wartości zostaną uśrednione.
- Minimum
- Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
- Mniejszość
- Jako danych wejściowych można użyć tylko rastra całkowitoliczbowego.
- Ustalana jest częstotliwość występowania każdej unikalnej wartości komórki w każdym sąsiedztwie. Jeśli istnieje pojedyncza wartość, która ma najniższą częstotliwość (występuje najrzadziej), wartość ta jest przypisywana do wszystkich komórek w tym sąsiedztwie. W przypadku remisu przypisywana jest najniższa z równie często występujących wartości, chyba że wartość przetwarzanej komórki także występuje z tą samą częstotliwością, jak jedna z analizowanych. W takim przypadku zwracana jest oryginalna wartość przetwarzanej komórki.
- Percentyl
- Dane wejściowe mogą być rastrem całkowitoliczbowym lub zmiennoprzecinkowym.
- Raster wynikowy będzie zawsze zmiennoprzecinkowy.
- Wynik dla statystyki percentylowej jest obliczany na podstawie następującego wzoru (Hyndman i Fan, 1996):
pk = (k-1)/(n-1)
- Zakres
- Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
- Wartości dla każdej lokalizacji komórki w rastrze wynikowym są określane komórka po komórce przy użyciu formuły: Focal Range = Focal Maximum – Focal Minimum
- Odchylenie standardowe
- Raster wynikowy będzie zawsze zmiennoprzecinkowy.
- W przypadku typu sąsiedztwa typu Waga jest to jeden z obsługiwanych podzbiorów typów statystyk. Szczegółowe informacje na temat sposobu obliczania tych statystyk zawiera sekcja Sąsiedztwo typu ważonego.
- Odchylenie standardowe jest obliczane na całej populacji (metoda N), a nie szacowane na podstawie próbki (metoda N-1).
- Suma
- Jeśli raster wejściowy jest całkowitoliczbowy, wartości w rastrze wynikowym będą całkowitoliczbowe. Jeśli wartości wejściowe są zmiennoprzecinkowe, wartości w rastrze wynikowym będą zmiennoprzecinkowe.
- W przypadku typu sąsiedztwa typu Waga jest to jeden z obsługiwanych podzbiorów typów statystyk. Szczegółowe informacje na temat sposobu obliczania tych statystyk zawiera sekcja Sąsiedztwo typu ważonego.
- Zróżnicowanie
- Jako danych wejściowych można użyć tylko rastra całkowitoliczbowego.
Obliczanie sąsiedztwa typu ważonego
Wielkość wpływu, jaki każda wartość w sąsiedztwie ma na ostateczny wynik dla przetwarzanej komórki, może być korygowana poprzez zastosowanie wag.
W kolejnych sekcjach przedstawiono wzory użyte do obliczenia wyników dla ważonych statystyk średniej, odchylenia standardowego i sumy. Do każdego z nich dołączony jest przykład pokazujący obliczenia dla przetwarzanej komórki oraz wyniki dla prostokątnego sąsiedztwa o wymiarach 3 na 3 komórki.
Statystyka średniej ważonej
Dla sąsiedztwa typu Waga ze statystyką Średnia, wartość wynikowa dla centralnej przetwarzanej komórki jest sumą iloczynów wartości wag skupienia i wartości wejściowych, podzieloną przez sumę wartości wag skupienia.
Wzór zastosowany do komórek w sąsiedztwie jest następujący:
Gdzie:
- µW jest średnią ważoną wartością populacji dla przetwarzanej komórki.
- N jest liczbą komórek w sąsiedztwie.
- wi jest wartością wagi zdefiniowaną w skupieniu.
- xi jest wartością komórki wejściowej.
Wcześniejsze:
W poprzednich wersjach w obliczeniach używano liczby komórek w sąsiedztwie jako mianownika.
Wartości wag muszą być dodatnie i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi.
Przykład
Rozważmy następującą przetwarzaną komórkę o wartości 7 i osiem otaczających ją komórek sąsiadujących:
4 6 7 6 7 8 4 5 6
Średnia matematyczna (suma/liczba) tych wartości wynosi 53/9 = 5,889.
Rozważ następujące ważone skupienie komórek 3 x 3:
3 3 0,0 0,5 0,0 0,5 2,0 0,5 0,0 0,5 0,0
Skupienie to nadaje najwyższy stopień wpływu komórce centralnej (waga 2), zmniejsza wpływ czterech ortogonalnych sąsiadów przetwarzanej komórki (waga 0,5) i sprawia, że cztery komórki narożne nie mają wpływu (waga 0).
Stosując wzór na średnią ważoną podany powyżej, poniżej przedstawiono obliczenia pozwalające uzyskać ostateczną wartość.
= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) / (w1 + w2 + w3 + w4 + w5 + w6 + w7 + w8 + w9) = ((0*4)+(0.5*6)+(0*7)+(0.5*6)+(2.0*7)+(0.5*8)+(0*4)+(0.5*5)+(0*6)) / (0 + 0.5 + 0 + 0.5 + 2.0 + 0.5 + 0 + 0.5 + 0) = (0 + 3.0 + 0 + 3.0 + 14.0 + 4.0 + 0 + 2.5 + 0) / (0.5 + 0.5 + 2.0 + 0.5 + 0.5) = (3.0 + 3.0 + 14.0 + 4.0 + 2.5) / 4.0 = 26.5 / 4.0 = 6.625
Dla porównania zwykła średnia z dziewięciu komórek wejściowych wynosiłaby 5,889. Gdyby uwzględnić tylko pięć komórek wejściowych, które znajdują się w skupieniu (gdzie waga nie jest równa 0), ale bez uwzględnienia wartości wag, średnia wyniosłaby 6,4 (gdzie 6 + 6 + 7 + 8 + 5 = 32, co należy podzielić przez liczbę komórek, czyli 5).
Statystyka ważonego odchylenia standardowego
W przypadku sąsiedztwa typu Waga ze statystyką Odchylenie standardowe, wartość wynikowa dla przetwarzanej komórki jest wynikiem następującego równania:
Gdzie:
- SDW jest ważoną wartością odchylenia standardowego populacji dla przetwarzanej komórki.
- µW jest średnią ważoną wartością populacji dla przetwarzanej komórki.
- N jest liczbą komórek w sąsiedztwie.
- wi jest wartością wagi zdefiniowaną w skupieniu.
- xi jest wartością komórki wejściowej.
Wartości wag muszą być dodatnie i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi.
Jeśli wszystkie wartości wejściowe w sąsiedztwie są takie same, wartość odchylenia standardowego dla tej przetwarzanej komórki wyniesie 0.
Przykład
Te same wartości sąsiedztwa, które zostały użyte w powyższym przykładzie średniej ważonej, zostaną ponownie użyte w tym przykładzie.
4 6 7 6 7 8 4 5 6
Zastosowane zostaną również te same ważone wartości skupienia:
3 3 0,0 0,5 0,0 0,5 2,0 0,5 0,0 0,5 0,0
Jeśli podane powyżej równanie ważonego odchylenia standardowego zostanie zastosowane do centralnej przetwarzanej komórki o wartości 7, obliczone ważone odchylenie standardowe wyniesie około 0,85696.
Statystyka sumy ważonej
Dla sąsiedztwa typu Waga ze statystyką Suma, wartość wynikowa dla przetwarzanej komórki jest wynikiem następującego równania:
Gdzie:
- SW jest ważoną wartością sumy dla przetwarzanej komórki.
- N jest liczbą komórek w sąsiedztwie.
- wi jest wartością wagi zdefiniowaną w skupieniu.
- xi jest wartością komórki wejściowej.
Wartości wag mogą być dodatnie lub ujemne i mogą być liczbami całkowitymi lub zmiennoprzecinkowymi.
Przykład
Rozważ następujące wartości wejściowe sąsiedztwa:
4 6 7 6 7 8 4 5 6
Rozważ następujące ważone skupienie komórek 3 x 3:
3 3 -1 -2 -1 0 0 0 1 2 1
Stosując powyższe równanie, poniżej przedstawiono obliczenia używane do uzyskania ostatecznej wartości:
= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) = ((-1*4) + (-2*6) + (-1*7) + (0*6) + (0*7) + (0*8) + (1*4) + (2*5) + (1*6)) = (-4) + (-12) + (-7) + 4 + 10 + 6 = -3
Odniesienia
Hyndman, R.J. i Y. Fan, listopad 1996. „Sample Quantiles in Statistical Packages”. The American Statistician 50 (4): 361-365.