كيفية عمل أدوات الإحصائيات النطاقية

عملية الإحصائيات النطاقية هي عملية تحسب الإحصائيات على قيم الخلايا الخاصة بالبيانات النقطية (بيانات نقطية للقيمة) داخل المناطق المحددة بواسطة مجموعة بيانات أخرى. توجد أداتان تحسبان الإحصائيات حسب المناطق، الإحصائيات النطاقية والإحصائيات النطاقية كجدول.

تحسب أداة الإحصائيات النطاقية إحصائية واحدة فقط في كل مرة وتنشئ ناتج بيانات نقطية. تصبح هذه القيمة قيمة الخلية الخاصة بناتج البيانات النقطية للخلايا المتوافقة مع تلك المنطقة. إذا كان معلم المنطقة يحتوي على مناطق متراكبة، تُحسب الإحصائية لمنطقة واحدة فقط لأن الخلية في البيانات النقطية الناتجة قد تمثل قيمة واحدة فقط.

تحسب أداة الإحصائيات النطاقية كجدول إحصائية واحدة أو إحصائيات متعددة باستخدام مجموعات فرعية محددة مسبقًا أو جميع الإحصائيات وتنشئ ناتج جدول. كما في الإحصائيات النطاقية، تعد الإحصائية الناتجة قيمة فردية لكل منطقة. يوجد سجل واحد لكل منطقة في الجدول الناتج ويتم الإبلاغ عن قيم الإحصائيات في حقول محددة مسبقًا. إذا كان إدخال المنطقة معلمًا ويحتوي على مناطق متراكبة، تُحسب الإحصائيات لجميع المناطق ويتم الإبلاغ بالناتج في سجلات فردية لكل منطقة.

تحدد طبقة منطقة الإدخال شكل المناطق وقيمها ومواقعها، والتي قد تكون إما بيانات نقطية أو معلمًا. يتم تحويل بيانات المعلم أولاً إلى بيانات نقطية في أثناء العملية النطاقية. في البيانات النقطية، تكون المنطقة هي جميع الخلايا التي تتضمن القيمة نفسها، سواء أكانت متجاورة أم لا. يجب أن تتضمن كل منطقة هوية فريدة ويجب أن تتضمن المنطقة نوع بيانات عددًا صحيحًا إذا كانت بيانات نقطية. يمكن تحديد أي عدد صحيح أو حقل سلسلة من القيم الفريدة في إدخال المنطقة لتحديد المناطق.

تحتوي البيانات النقطية لقيمة الإدخال على القيم المستخدمة في حساب الإحصائية الناتجة لكل منطقة. قد تكون خاصة بعدد صحيح أو نوع بيانات عائمة.

في المثال التوضيحي التالي، يتحدد متوسط إدخال القيمة لكل منطقة:

مثال على الإدخالات والناتج من الإحصائيات النطاقية
يتم توضيح مثال على الإدخالات والناتج من الإحصائيات النطاقية. تمثل الخلايا ذات اللون الرمادي الفاتح NoData.

كيفية تحديد الخلايا في بيانات نقطية لقيمة لمنطقة بيانات نقطية

لحساب إحصائية، تستخرج الأداة أولاً قيم الخلايا من البيانات النقطية لجميع الخلايا التي تقع داخل كل منطقة. يُنفذ تحديد الخلايا في بيانات نقطية لقيمة داخل منطقة عن طريق تراكب المناطق على البيانات النقطية للقيمة. عندما تكون كل من إدخالات المنطقة والقيمة بيانات نقطية لحجم الخلية نفسه وتمت محاذاة الخلايا، تُستخرج قيم الخلية الخاصة بالبيانات النقطية للقيمة التي تتراكب مع تلك الخاصة بالمناطق وتُحسب الإحصائيات.

بيانات نقطية للمنطقة متراكبة على البيانات النقطية للقيمة تظهر مع تمييز الخلايا المستخرجة
بيانات نقطية للمنطقة متراكبة على البيانات النقطية للقيمة تظهر مع تمييز الخلايا المستخرجة.

عندما يكون حجم الخلية أو محاذاة البيانات النقطية للمنطقة مختلفًا عن حجم البيانات النقطية للقيمة، لا يمكن تراكب الخلايا الموجودة بين المنطقة والبيانات النقطية للقيمة بشكل مثالي بعضها على بعض. تضبط الأداة بعد ذلك إحدى مجموعتي البيانات النقطية أو كلتيهما داخليًا لتحقيق هذا التراكب المثالي للخلايا. يُنفذ هذا الضبط باتباع بعض القواعد البسيطة. عندما يكون حجم خلية البيانات النقطية للمنطقة والبيانات النقطية للقيمة مختلفًا، سيكون حجم خلية الناتج قيمة الحد الأقصى للإدخالات، وستُستخدم البيانات النقطية للقيمة كانطباق البيانات النقطية داخليًا. إذا كان حجم الخلية هو نفسه ولكن الخلايا غير محاذاة، فسيتم استخدام القيمة النقطية كبيانات نقطية للانطباق داخليًا. ستؤدي أي من هاتين الحالتين إلى إعادة أخذ عينات داخلية قبل إجراء عملية المنطقة.

كيفية تحديد الخلايا في بيانات نقطية للقيمة لمنطقة معالم

العملية النطاقية هي في الأساس تحليل بيانات نقطية يُنفذ على مجموعتي بيانات نقطية، تكون المنطقة إحداهما وتكون الأخرى القيمة. في حال تحديد المناطق حسب المعالم، فسيحدث تحويل معلم داخلي إلى البيانات النقطية. يستخدم التحويل الداخلي لمنطقة مضلع طريقة مركز الخلية في أداة تحويل المعلم إلى بيانات نقطية لتحويل الإدخال إلى بيانات نقطية باستخدام حجم الخلية وانطباق البيانات النقطية الخاص بالبيانات النقطية للقيمة.قد يؤدي ذلك إلى نتيجة غير متوقعة تتمثل في مناطق مفقودة في الناتج في حال عدم وقوع أي من مراكز الخلية الخاصة بشبكة التحويل إلى بيانات نقطية ضمن منطقة المعلم. قد يحدث ذلك مع المناطق الأصغر من مساحة الخلية الخاصة بالبيانات النقطية للمنطقة الداخلية ومع المناطق الأكبر أيضًا.

في المثال التالي، يمثل الشكل (1) منطقة معلم الإدخال والبيانات النقطية لقيمة الإدخال ومركز الخلية الخاص بها. تتضمن معالم الإدخال ثلاث مناطق (الأشكال الصفراء)، حيث يكون ما يلي صحيحًا:

  • zone1 أكبر من خلية فردية.
  • zone2 وzone3 أصغر من خلية.
  • مركز خلية يقع خارج zone2 لكن ضمن zone3.

أثناء عملية تحويل المنطقة إلى بيانات نقطية في الشكل (2)، بما أنه لا توجد مراكز خلية تقع ضمن zone1 وzone2، يتم تحويل zone3 فقط إلى بيانات نقطية، وتختفي المنطقتان الأخريان بشكل أساسي.

التحويل الداخلي لمنطقة المعلم في أثناء حساب الإحصائيات النطاقية
التحويل الداخلي لمنطقة معلم في أثناء حساب الإحصائيات النطاقية موضح.

لتجنب اختفاء المناطق من الناتج، تأكد من احتواء كل منطقة على مركز خلية واحد أو أكثر من البيانات النقطية للقيمة. تتمثل إحدى طرق القيام بذلك في إنشاء المزيد من مراكز الخلايا عن طريق تحديد حجم خلية أصغر في البيئة. افتراضيًا، يكون حجم خلية التحليل هو حجم البيانات النقطية للقيمة. مع ذلك، إذا حددت حجم خلية في بيئة التحليل أصغر من تلك الخاصة بالبيانات النقطية للقيمة، فستُمكِّن التقاط المزيد من المناطق، كما يوضح الشكل (3) بالأعلى. ضع في اعتبارك أن تحديد حجم خلية أصغر سيؤدي إلى إنشاء بيانات نقطية أكبر للناتج. لن يثمر الناتج ذو الدقة الأعلى بالضرورة نتيجة عالية الجودة كما يبدو، نظرًا إلى أن التفاصيل الإضافية غير موجودة بالفعل في البيانات النقطية المدخلة للقيمة.

بمجرد تحويل منطقة معلم إلى منطقة بيانات نقطية باستخدام حجم الخلية نفسه ومحاذاة الخلية للبيانات النقطية للقيمة، يُنفذ استخراج الخلايا من البيانات النقطية للقيمة ضمن منطقة من خلال تراكب المناطق على البيانات النقطية للقيمة.

حساب الإحصائيات الحسابية والدائرية

قد يعمل حساب المتوسط عن طريق جمع كل قيم الخلية، ثم القسمة على عدد الخلايا، مع بيانات مثل الارتفاع. على الرغم من ذلك، إذا كانت بياناتك تمثل كميات دورية مثل الاتجاه (اتجاه البوصلة من 0 إلى 360 درجة بالدرجات) أو ساعات اليوم (من 0 إلى 24 ساعة)، فسيثمر حساب المتوسط الحسابي ناتجًا غير صحيح، لأن الحد الأدنى والحد الأقصى للقيمة يمثلان الكمية نفسها. بالنسبة إلى هذا النوع من البيانات، يجب عليك حساب الإحصائيات الدائرية.

على سبيل المثال، إذا كنت تحسب متوسط قيمتين من الخلايا، 0 و360 درجة، فسيكون المتوسط الحسابي 180 درجة. يكون ذلك غير صحيح لأن الدرجتين 0 و360 تمثلان اتجاه البوصلة نفسه. يمكن الحصول على الإحصائيات الصحيحة من خلال حساب المتوسط الدائري، والذي سيكون 0 درجة.

يمكنك تحديد حساب الإحصائيات الدائرية من خلال التأشير على معلمة حساب الإحصائيات الدائرية (circular_calculation = "CIRCULAR" في Python). عند حساب الإحصائيات الدائرية، انتبه إلى القيم الأدنى والأعلى لتمثيل البيانات الدورية. يُفترض أن تكون أقل قيمة 0. يمكن تحديد أعلى قيمة كمعلمة قيمة الالتفاف الدائرية (circular_wrap_value in Python). القيمة الافتراضية لهذه المعلمة هي 360.

بناءً على نوع بياناتك، حدد نوع حساب الإحصائيات، وقيمة التفاف دائرية مناسبة للإحصائيات الدائرية، للحصول على الناتج الصحيح. الإحصائيات الدائرية التالية مدعومة: المتوسط، والأغلبية والأقلية والانحراف المعياري، والتنوع.

حساب الإحصائيات النطاقية باستخدام البيانات النقطية المتعددة الأبعاد

تمثل البيانات النقطية المتعددة الأبعاد البيانات في أوقات وأعماق أو ارتفاعات متعددة. يُستخدم هذا النوع من البيانات بشكل شائع في علوم الغلاف الجوي وعلوم المحيطات والأرض ويُرصد من خلال منصات المراقبة، أو يُلتقط بواسطة الأقمار الصناعية أو يُستخلص من نماذج المحاكاة العددية حيث تتم معالجة البيانات أو تجميعها أو استيفاؤها باستخدام تقنيات إحصائية متنوعة.

تدعم أدوات الإحصائيات النطاقية والإحصائيات النطاقية كجدول المنطقة المتعددة الأبعاد والبيانات النقطية للقيمة كإدخال. تُحسب الإحصائيات النطاقية لجميع شرائح البيانات النقطية المتعددة الأبعاد عند تحديد معلمة المعالجة كمتعددة الأبعاد (ALL_SLICES في معلمة process_as_multidimensional في Python). في حال إلغاء تحديد معلمة المعالجة كمتعددة الأبعاد (CURRENT_SLICES في Python)، ستعالج الشريحة الحالية فقط.

تتضمن الأمثلة على تحليل الإحصائيات النطاقية على البيانات المتعددة الأبعاد ما يلي:

  • يرغب عالم الأرصاد الجوية في معرفة حركة الإعصار وتوزيع هطول الأمطار على طول مسار الإعصار خلال فترة معينة. باستخدام المعالجة المتعددة الأبعاد في أداة الإحصائيات النطاقية، يمكن لعالم الأرصاد الجوية العثور على متوسط هطول الأمطار لكل شريحة زمنية لمناطق الأعاصير التي تغيرت بمرور الوقت.
  • يرغب عالم البيئة في النظر في توزيع الظواهر الجوية القصوى من الحد الأقصى لبيانات هطول الأمطار اليومية خلال الثلاثين عامًا الماضية لحوض نهر معين. يمكن استخدام أداة الإحصائيات النطاقية كجدول مع النوع الإحصائي المئوي لقائمة القيم المئوية للنظر في توزيع الحد الأقصى لبيانات هطول الأمطار اليومية الخاصة ببيانات السلاسل الزمنية عند المعالجة على أنها متعددة الأبعاد.

الناتج المتعدد الأبعاد للإحصائيات النطاقية

عندما تحدد أن أداة الإحصائيات النطاقية ستعالج الإدخال على أنه متعدد الأبعاد، ستنشئ الأداة ناتج بيانات نقطية متعددة الأبعاد. تحدث العملية النطاقية شريحة بشريحة بين شرائح البيانات النقطية للمنطقة وشرائح المتغير الحالي من البيانات النقطية للقيمة. تُخزن قيم الإحصائية المحسوبة في متغير متعدد الأبعاد يتم إنشاء اسمه من خلال الجمع بين اسم المتغير من البيانات النقطية للقيمة والإحصائية المراد حسابها. يعتمد عدد أبعاد متغير الناتج وعدد الشرائح على الطبيعة المحددة لإدخالات البيانات النقطية للقيمة والمنطقة.

بالنسبة إلى الإحصائيات النطاقية كجدول، عندما تحدد أن البيانات ستخضع للمعالجة بوصفها متعددة الأبعاد، فسيتم إنشاء ناتج جدول مسطح باستخدام الإحصائيات المحسوبة لجميع المناطق والشرائح. سيتضمن هذا الجدول حقولاً إضافية للإشارة إلى اسم المتغير وأسماء البُعد وقيمه، بالإضافة إلى الإحصائيات التي تُحسب لكل منطقة.

نظرًا إلى حدوث المعالجة المتعددة الأبعاد شريحة بشريحة بين البيانات النقطية للمنطقة والقيمة، سيعتمد عدد الشرائح في البيانات النقطية المتعددة الأبعاد الناتجة من أداة الإحصائيات النطاقية وعدد السجلات في الجدول الناتج من أداة الإحصائيات النطاقية كجدول على نوع البيانات النقطية للإدخال وعدد الشرائح فيها. توضح الأقسام الفرعية التالية أمثلة.

البيانات النقطية المتعددة الأبعاد للقيمة والمنطقة، والتي تتضمن الأبعاد نفسها

سيتطلب العثور على الحد الأقصى للملوحة في أعماق مختلفة من المحيط لنطاقات درجات حرارة مختلفة عند العمق المقابل إجراء إحصائيات نطاقية تتضمن منطقة متعددة الأبعاد تمثل مناطق درجة الحرارة وبيانات نقطية للقيمة المتعددة الأبعاد تمثل الملوحة. ستُنفذ العملية النطاقية لكل شريحة منطقة مع الشريحة المتوافقة من البيانات النقطية للقيمة. ستتضمن البيانات النقطية المتعددة الأبعاد الناتجة عدد الشرائح نفسه الخاص بالبيانات النقطية للقيمة.

في المثال التوضيحي بالأسفل، تتضمن المتغيرات في كل من البيانات النقطية للمنطقة والقيمة الأبعاد الثلاثة المتماثلة x وy وd وعدد الشرائح نفسه في قيم الأبعاد d0، وd1 وd2. سيتضمن المتغير في البيانات النقطية المتعددة الأبعاد الناتجة أيضًا الأبعاد الثلاثة نفسها، x وy وd وعدد الشرائح نفسه في قيم البُعد d0، وd1 وd2.

المنطقة المتعددة الأبعاد والبيانات النقطية للقيمة التي تتضمن الأبعاد نفسها
المنطقة المتعددة الأبعاد والبيانات النقطية للقيمة التي تتضمن الأبعاد نفسها موضحة مع البيانات النقطية للإحصائيات النطاقية الناتجة.

يتحدد إجمالي عدد السجلات في ناتج الإحصائيات النطاقية كجدول من خلال إضافة عدد المناطق في كل شريحة. إذا كان عدد المناطق على الأعماق d0 وd1 وd2 هو 5 و4 و3 على التوالي، فسيصبح إجمالي عدد السجلات 12 (5 + 4 + 3 = 12).

المنطقة المتعددة الأبعاد والبيانات النقطية للقيمة التي تتضمن أبعادًا مختلفة

يمكن تحديد موقع ونافذة وقت مناسبة لنشر الأصول مثل المركبات التي يتم تشغيلها عن بُعد (ROVs)، من خلال تنفيذ إحصائيات نطاقية باستخدام منطقة متعددة الأبعاد تمثل المواقع المحتملة لمركبات ROV في أوقات مختلفة، وبيانات نقطية للقيمة متعددة الأبعاد مثل ناتج نموذج المحيطات الهجين المنسق (HYCOM) الذي يمثل تيار المحيط عند أعماق وأوقات مختلفة.

ستُنفذ العملية النطاقية لكل شريحة من البيانات النقطية للمنطقة باستخدام كل شريحة من البيانات النقطية للقيمة. يتحدد عدد الشرائح في البيانات النقطية المتعددة الأبعاد الناتجة من خلال ضرب عدد شرائح البيانات النقطية للمنطقة في عدد شرائح البيانات النقطية للقيمة.

في المثال التوضيحي بالأسفل، يتضمن المتغير في البيانات النقطية للمنطقة ثلاثة أبعاد x وy وd وثلاث شرائح في قيم الأبعاد d0 وd1 وd2. يتضمن المتغير في البيانات النقطية للقيمة ثلاثة أبعاد x وy وd وشريحتين في قيم الأبعاد t0 وt1. سيتضمن المتغير في البيانات النقطية المتعددة الأبعاد الناتجة أيضًا أربعة أبعاد—x وy وd وt.

المنطقة المتعددة الأبعاد والبيانات النقطية للقيمة التي تتضمن أبعادًا مختلفة
المنطقة المتعددة الأبعاد والبيانات النقطية لإدخال القيمة التي تتضمن أبعادًا مختلفة موضحة مع البيانات النقطية للإحصائيات النطاقية الناتجة.

يتحدد إجمالي عدد الشرائح في ناتج أداة الإحصائيات النطاقية من خلال ضرب عدد الأعماق في البيانات النقطية للمنطقة وعدد الخطوات الزمنية في البيانات النقطية للقيمة، والتي ستكون، في هذه الحالة، 6 (3 أعماق x خطوتين زمنيتين = 6). يتحدد إجمالي عدد السجلات في ناتج الإحصائيات النطاقية كجدول من خلال ضرب عدد المناطق في كل شريحة. إذا كان عدد المناطق 5، فسيكون إجمالي عدد السجلات في هذه الحالة 30 (5 مناطق × 3 أعماق × خطوتين زمنيتين = 30).

البيانات النقطية المتعددة الأبعاد للقيمة فقط

سيتطلب البحث عن الحد الأقصى لدرجة الحرارة داخل كل دولة لكل يوم في السنة تنفيذ الإحصائيات النطاقية باستخدام البيانات النقطية المتعددة الأبعاد للقيمة والتي تمثل درجة الحرارة اليومية، وبيانات نقطية للمنطقة تمثل المقاطعات. ستُنفذ العملية النطاقية لكل شريحة من البيانات النقطية للقيمة باستخدام البيانات النقطية للمنطقة نفسها. ستتضمن البيانات النقطية المتعددة الأبعاد الناتجة عدد الشرائح نفسه الخاص بالبيانات النقطية للقيمة.

في المثال التوضيحي بالأسفل، تتضمن المتغيرات في البيانات النقطية للقيمة ثلاثة أبعاد x وy وt وثلاث شرائح في قيم الأبعاد t0 وt1 وt2. سيتضمن المتغير في البيانات النقطية المتعددة الأبعاد الناتجة أيضًا الأبعاد الثلاثة نفسها x وy وt وعدد الشرائح نفسه في قيم البُعد t0، وt1 وt2.

معالجة البيانات النقطية المتعددة الأبعاد للقيمة
معالجة البيانات النقطية المتعددة الأبعاد للقيمة موضحة.

يتحدد إجمالي عدد السجلات في ناتج الإحصائيات النطاقية كجدول من خلال ضرب عدد المناطق وعدد الشرائح في البيانات النقطية للقيمة. إذا كان عدد المناطق 5، فسيكون إجمالي عدد السجلات 15 (5 × 3 = 15).

البيانات النقطية المتعددة الأبعاد للمنطقة فقط

سيتطلب البحث عن متوسط الحد الأقصى لهطول الأمطار بشكل عقدي في كل فئة من مناطق السهول الفيضية المتغيرة بمرور الوقت والتي تتغير بمرور الوقت من أجل تخطيط المناظر الطبيعية البيئية إجراء الإحصائيات النطاقية باستخدام البيانات النقطية المتعددة الأبعاد للمنطقة والتي تمثل مناطق السهول الفيضية وبيانات نقطية للقيمة تمثل الحد الأقصى لهطول الأمطار العقدية. ستُنفذ العملية النطاقية لكل شريحة من البيانات النقطية للمنطقة باستخدام البيانات النقطية للقيمة نفسها. ستتضمن البيانات النقطية المتعددة الأبعاد الناتجة عدد الشرائح نفسه الخاص بالبيانات النقطية للمنطقة.

في المثال التوضيحي بالأسفل، تتضمن المتغيرات في البيانات النقطية للمنطقة ثلاثة أبعاد x وy وt وثلاث شرائح في قيم الأبعاد t0 وt1 وt2. سيتضمن المتغير في البيانات النقطية المتعددة الأبعاد الناتجة أيضًا الأبعاد الثلاثة نفسها x وy وt وعدد الشرائح نفسه في قيم البُعد t0، وt1 وt2.

معالجة البيانات النقطية المتعددة الأبعاد للمنطقة
معالجة البيانات النقطية المتعددة الأبعاد للمنطقة موضحة.

يتحدد إجمالي عدد السجلات في ناتج الإحصائيات النطاقية كجدول من خلال ضرب عدد المناطق وعدد الشرائح في البيانات النقطية للمنطقة. إذا كان عدد المناطق 5، فسيكون إجمالي عدد السجلات 15 (5 × 3 = 15).

الإحصائيات

يتم سرد أنواع الإحصائيات المتاحة لحساب الإحصائيات النطاقية أدناه مع تفاصيل إضافية ورسم توضيحي يُظهر النتائج لكل خيار في مثال على الإدخال.

الأغلبية

  • تُعين القيمة الأكثر تكرارًا في كل منطقة لجميع الخلايا في تلك المنطقة.
  • عند وجود ربط لقيمة الأغلبية في إحدى المناطق، تُعين أدنى قيمة مربوطة لناتج جميع مواقع الخلايا في المنطقة.

مثال:

توضيح لأغلبية الإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Majority")

الحد الأقصى

  • تُعين أعلى قيمة في كل منطقة لجميع الخلايا في تلك المنطقة.

مثال:

توضيح للحد الأقصى للإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Maximum")

المتوسط

  • يُعين متوسط القيم في كل منطقة لجميع الخلايا الناتجة في تلك المنطقة.
  • تكون صيغة المتوسط الحسابي كما يلي:

    صيغة المتوسط الحسابي

    حيث:

    • = المتوسط
    • xi = القيم المرصودة
    • N = عدد عمليات الرصد
  • تكون صيغة المتوسط الدائري كما يلي:

    صيغة المتوسط الدائري

    حيث:

    • = المتوسط الدائري
    • xi = القيم المرصودة
    • N = عدد عمليات الرصد

    في الحالة المتدهورة حيث يكون كل من Σsin xi و cos xi مساويًا للصفر، تُستخدم القيمة الخاصة -1، مما يشير إلى أن المتوسط الدائري غير محدد جيدًا.

مثال:

توضيح لمتوسط الإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Mean")

متوسط

  • يُعين معدل القيم في كل منطقة لجميع الخلايا الناتجة في تلك المنطقة.
  • تُحسب قيم نوع الإحصائيات باستخدام الطريقة Q1 من Hyndman and Fan (1996). عندما تكون القيمتان اللتان تم فرزهما قريبتين بشكل متساوٍ من قيمة المعدل الهدف، يتم اختيار أصغر القيمتين.
  • لحساب المعدل، يتم تصنيف جميع الخلايا في المنطقة. في حال وجود خلايا n في المنطقة وكانت n فردية، تُكتب القيمة الوسطى ((n+1)/2) لكل خلية في المنطقة. في حال وجود عدد زوجي من الخلايا، يكون الناتج القيمة (n/2).

مثال:

توضيح للإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Median")

الحد الأدنى

  • تُعين أدنى قيمة في كل منطقة لجميع الخلايا في تلك المنطقة.

مثال:

توضيح للحد الأدنى من الإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Minimum")

الأقلية

  • تُعين القيمة الأقل تكرارًا في كل منطقة لجميع الخلايا في تلك المنطقة.
  • عند وجود ربط لقيمة الأقلية في إحدى المناطق، تُعين أدنى القيم المربوطة لناتج جميع مواقع الخلايا في المنطقة.

مثال:

توضيح لأقلية الإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Minority")

القيمة المئوية

  • تُعين النسبة المئوية للقيم في كل منطقة لجميع الخلايا الناتجة في تلك المنطقة.
  • تُحسب قيمة نوع الإحصائيات هذه باستخدام الطريقة Q1 من Hyndman and Fan (1996). عندما تكون القيمتان اللتان تم فرزهما قريبتين بشكل متساوٍ من قيمة المعدل الهدف، يتم اختيار أصغر القيمتين.
  • لحساب النسبة المئوية، تُصنف جميع الخلايا في بيانات نقطية للقيمة باستخدام الصيغة التالية: R = P/100 x (n - 1) +1، حيث تكون P هي النسبة المئوية المرغوب فيها، وn عدد الخلايا.

مثال:

توضيح للنسبة المئوية للإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Percentile")

نطاق

  • يُعين الفرق بين الحدين الأقصى والأدنى للقيم لجميع الخلايا في تلك المنطقة.
  • يُحدد النطاق كما يلي:
    النطاق النطاقي = الحد الأقصى النطاقي – الحد الأدنى النطاقي

مثال:

توضيح لنطاق الإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Range")

الانحراف المعياري

  • يُعين الانحراف المعياري للقيم في كل منطقة لجميع الخلايا في تلك المنطقة.
  • تكون صيغة الانحراف المعياري الحسابي كما يلي:

    صيغة الانحراف المعياري

    حيث:

    • σ = الانحراف المعياري
    • xi = القيم المرصودة
    • = المتوسط
    • N = عدد عمليات الرصد
    ملاحظة:‏

    يُحسب الانحراف المعياري على التعداد السكاني بالكامل (الطريقة N)، ولا يُقدر بناءً على عينة (الطريقة N-1). للمقارنة، يعادل حساب الانحراف المعياري طريقة STDEVP، وليس طريقة STDEV في Microsoft Excel.

  • تكون صيغة الانحراف المعياري الدائري كما يلي:

    صيغة الانحراف المعياري الدائري

    حيث:

    • σ = انحراف معياري دائري
    • = متوسط الطول الناتج لـ البيانات الخطية a

      في عينة لزوايا n بالدرجات، يتم تلخيص الزوايا a1 وa2 وan، ويتم تمثيل كل زاوية بواسطة بيانات خطية للوحدة، البيانات الخطية a والتي تشير في اتجاه الرصد المتوافق.

مثال:

توضيح لانحراف معياري للإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "STD")

مجموع

  • يتم تعيين مجموع جميع قيم الخلايا في كل منطقة لجميع الخلايا في تلك المنطقة.
  • يعد نوع البيانات الخاص بالبيانات النقطية الناتجة نقطة طافية. هذا لأن قيمة المجموع تميل إلى أن تكون كبيرة للغاية، وقد يكون من غير الممكن تمثيلها بقيمة عدد صحيح.

    ضع في اعتبارك، على سبيل المثال، منطقة تتضمن خلايا يبلغ حجمها 2,500 صف وعمود، وتقدر قيمة كل خلية بـ 1,000. سيكون مجموع تلك المنطقة 2,500 × 2,500 × 1,000 = 6.25 مليارات. إذا كان من الضروري توفير ناتج بعدد صحيح وكان النطاق ضمن ± 2.147 مليار، يمكنك تطبيق أداة Int.

مثال:

توضيح لمجموع الإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Sum")

متنوع

  • يتم تعيين عدد القيم الفريدة في كل منطقة لجميع الخلايا في تلك المنطقة

مثال:

توضيح لمتنوع الإحصائيات النطاقية
OutRas = ZonalStatistics(ZoneRas, "VALUE", ValRas, "Variety")

نوع البيانات الناتجة

يتحدد نوع البيانات الناتجة (عدد صحيح أو طاف) وفقًا لكل من الحساب النطاقي الذي يتم تنفيذه ونوع البيانات النقطية لقيمة الإدخال. يحدد الجدول التالي أنواع البيانات المتوقعة للبيانات النقطية الناتجة:

احصائياتنوع إدخال القيمةالمخرجات

الأغلبية

عدد صحيح*

عدد صحيح

الحد الأقصى

عدد صحيح، طافٍ

مماثل للقيمة

المتوسط

عدد صحيح، طافٍ

تعويم

متوسط

عدد صحيح، طافٍ

عدد صحيح

الحد الأدنى

عدد صحيح، طافٍ

مماثل للقيمة

الأقلية

عدد صحيح*

عدد صحيح

القيمة المئوية

عدد صحيح، طافٍ

عدد صحيح

نطاق

عدد صحيح، طافٍ

مماثل للقيمة

الانحراف المعياري

عدد صحيح، طافٍ

تعويم

مجموع

عدد صحيح، طافٍ

تعويم

متنوع

عدد صحيح*

عدد صحيح

أنواع المدخل والناتج حسب الإحصائية
ملاحظة:‏

* الأعداد الصحيحة فقط مدعومة.

إذا كان أي موقع خلية في مجموعة بيانات المنطقة هو NoData، فسيتم تعيين NoData لهذا الموقع في الناتج.

‏‏مراجع

Rob J. Hyndman and Yanan Fan (1996) "Sample Quantiles in Statistical Packages" The American Statistician, Vol. 50, No. 4 (Nov., 1996), pp. 361-365.