W przypadku narzędzia Statystyki komórki wartość każdej lokalizacji w rastrze wynikowym jest obliczana jako funkcja wartości komórki ze wszystkich danych wejściowych w tej lokalizacji. Poniżej przedstawiono dodatkowe szczegóły i kilka przykładów poszczególnych statystyk.
Średnia
- Określa wartość średnią danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Wynikowa wartość średnia jest zawsze zmiennoprzecinkowa.
- Przykład:
Większość
- Określa wartość, która występuje najczęściej w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Jeśli wszystkie dane wejściowe są liczbami całkowitymi, wynik jest liczbą całkowitą. Jeśli dowolne z danych wejściowych są liczbami zmiennoprzecinkowymi, wynik jest liczbą zmiennoprzecinkową.
- Jeśli istnieje więcej niż jedna wartość większości dla danej lokalizacji komórki, dane wynikowe dla tej lokalizacji przyjmują wartość Brak danych.
- Jeśli wszystkie wartości wejściowe dla lokalizacji komórki są takie same, wynikowa wartość większości dla tej lokalizacji jest taka sama jak wejściowa.
- Odpowiednie zastosowanie powinno obejmować co najmniej trzy wejścia. Jeśli dostępne będzie tylko jedno wejście, wynik będzie duplikatem danych wejściowych.
- Jeśli dostępne będą tylko dwa wejścia, w każdej lokalizacji, w której wartości będą różne, zostanie zapisana wartość Brak danych. Ponieważ istnieją tylko dwie różne wartości do wyboru, nie istnieje wartość większości. Jeśli wartości są takie same, w rastrze wynikowym zostanie zapisana ta właśnie wartość.
Maksimum
- Określa największą wartość w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Jeśli wszystkie dane wejściowe są liczbami całkowitymi, wynik jest liczbą całkowitą. Jeśli dowolne z danych wejściowych są liczbami zmiennoprzecinkowymi, wynik jest liczbą zmiennoprzecinkową.
Mediana
- Określa wartość mediany danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Jeśli liczba wejść jest nieparzysta, wartość mediany jest obliczana przez uszeregowanie wartości i wybór wartości środkowej. Jeśli liczba wejść jest parzysta, wartości zostają uszeregowane i obliczana jest średnia dwóch wartości środkowych. Ta wartość zostanie obcięta do liczby całkowitej, jeśli wszystkie siatki wejściowe są typu całkowitoliczbowego.
- Jeśli wszystkie dane wejściowe są liczbami całkowitymi, wynik jest liczbą całkowitą. Jeśli dowolne z danych wejściowych są liczbami zmiennoprzecinkowymi, wynik jest liczbą zmiennoprzecinkową.
Minimum
- Określa najmniejszą wartość w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Jeśli wszystkie dane wejściowe są liczbami całkowitymi, wynik jest liczbą całkowitą. Jeśli dowolne z danych wejściowych są liczbami zmiennoprzecinkowymi, wynik jest liczbą zmiennoprzecinkową.
Mniejszość
- Określa wartość, która występuje najrzadziej w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Jeśli istnieje więcej niż jedna wartość mniejszości dla danej lokalizacji komórki, dane wynikowe dla tej lokalizacji przyjmują wartość Brak danych.
- Jeśli wszystkie wartości wejściowe dla lokalizacji komórki są takie same, wynikowa wartość mniejszości dla tej lokalizacji jest taka sama jak wejściowa.
- Odpowiednie zastosowanie powinno obejmować co najmniej trzy wejścia. Jeśli dostępne będzie tylko jedno wejście, wynik będzie duplikatem danych wejściowych.
- Jeśli dostępne będą tylko dwa wejścia, w każdej lokalizacji, w której wartości będą różne, zostanie zapisana wartość Brak danych. Ponieważ istnieją tylko dwie różne wartości do wyboru, nie istnieje wartość mniejszości. Jeśli wartości są takie same, w rastrze wynikowym zostanie zapisana ta właśnie wartość.
- Jeśli wszystkie dane wejściowe są liczbami całkowitymi, wynik jest liczbą całkowitą. Jeśli dowolne z danych wejściowych są liczbami zmiennoprzecinkowymi, wynik jest liczbą zmiennoprzecinkową.
Percentyl
- Określa percentyl wartości w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Wartość statystyki tego typu jest obliczana z użyciem metody Q1 opisanej w pozycji Hyndman i Fan (1996) [1]. Gdy od docelowej wartości mediany tak samo oddalone są dwie posortowane wartości, wybierana jest mniejsza z nich.
- W celu obliczenia percentyla do wszystkich komórek przypisywane są rangi z użyciem następującego wzoru: R = P/100 x (n - 1) +1, gdzie P to zażądany percentyl, a n to liczba komórek.
Range - Zakres
- Określa zakres wartości w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Jeśli wszystkie dane wejściowe są liczbami całkowitymi, wynik jest liczbą całkowitą. Jeśli dowolne z danych wejściowych są liczbami zmiennoprzecinkowymi, wynik jest liczbą zmiennoprzecinkową.
Std
- Określa odchylenie standardowe wartości w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Wynikowa wartość odchylenia standardowego jest zawsze zmiennoprzecinkowa.
- Należy zauważyć, że odchylenie standardowe jest obliczane na całej populacji (metoda N), a nie szacowane na podstawie próbki (metoda N-1).
Suma
- Określa sumę wartości w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Jeśli wszystkie dane wejściowe są liczbami całkowitymi, wynik jest liczbą całkowitą. Jeśli dowolne z danych wejściowych są liczbami zmiennoprzecinkowymi, wynik jest liczbą zmiennoprzecinkową.
Zróżnicowanie
- Określa liczbę unikalnych wartości w danych wejściowych, przetwarzając wszystkie komórki po kolei.
- Raster wynikowy jest zawsze typu całkowitoliczbowego.
Odniesienia
Hyndman, Rob J. i Fan, Yanan. 1996. „Sample Quantiles in Statistical Packages”. The American Statistician, Tom 50, Nr 4 (Listopad, 1996), str. 361–365.