كيفية عمل الإحصائيات البؤرية

تقوم أداة الإحصائيات البؤرية بتنفيذ عملية تحسب إحصائية للخلايا المدخلة ضمن مجموعة من النوافذ أو المجاورات المتداخلة. يتم حساب الإحصائية (على سبيل المثال، المتوسط أو الحد الأقصى أو المجموع) لجميع الخلايا المدخلة الموجودة داخل كل جوار.

معالجة الجوار

من الناحية النظرية، تقوم الخوارزمية بزيارة كل خلية في البيانات النقطية المدخلة وتحسب إحصائية للخلايا التي تقع في شكل الجوار المحدد حولها. ويشار إلى الخلية التي يتم حساب الإحصائيات لها باسم خلية المعالجة. عادةً ما يتم تضمين قيمة خلية المعالجة في حساب إحصائيات الجوار، ولكن اعتمادًا على شكل الجوار، قد لا يتم تضمينها. نظرًا لأن المجاورات سوف تتداخل في عملية المسح، فإن خلايا الإدخال المضمنة في حساب خلية معالجة واحدة قد تساهم أيضًا في حساب خلية معالجة أخرى.

تتوفر العديد من أشكال الجوار المحددة مسبقًا للاختيار من بينها. يمكنك أيضًا إنشاء شكل مخصص. الإحصائيات التي يمكنك حسابها لجوار ما هي الأغلبية، والحد الأقصى، والمتوسط، والمعدل، والحد الأدنى، والأقلية، والقيمة المئوية، والمدى، والانحراف المعياري، والمجموع، والتنوع.

مثال على الحساب

لتوضيح معالجة الجوار بالنسبة إلى الإحصائيات البؤرية، فكر في حساب إحصائية مجموع الجوار حول خلية المعالجة بقيمة 5 في الرسم البياني التالي. يتم تحديد شكل جوار مستطيل مكون من 3 × 3 خلايا ويتم ترك معلمة تجاهل NoData في العمليات الحسابية في الإعداد المحدد بشكل افتراضي. مجموع قيم الخلايا المجاورة (3 + 2 + 3 + 4 + 2 + 1 + 4 = 19) زائد قيمة خلية المعالجة (5) يساوي 24 (19 + 5 = 24). يتم إعطاء القيمة 24 للخلية الموجودة في البيانات النقطية الناتجة في نفس موقع خلية المعالجة في البيانات النقطية المدخلة.

يتم عرض القيم المدخلة لمثال جوار مكون من 3x3 خلية وقيمة المجموع الناتج لخلية المعالجة

يوضح الرسم البياني أعلاه كيفية إجراء العمليات الحسابية على خلية واحدة في البيانات النقطية المدخلة. في الرسم البياني التالي، تظهر النتائج لجميع الخلايا المدخلة. تحدد الخلايا المميزة باللون الأصفر نفس خلية المعالجة والجوار كما في المثال أعلاه.

يتم عرض جميع القيم المدخلة والناتجة لعملية المجموع البؤري

خلايا NoData

تتحكم معلمة تجاهل NoData في العمليات الحسابية في كيفية معالجة خلايا NoData الموجودة في نافذة الجوار. عند تحديد هذه المعلمة (ignore_nodata = "DATA" في Python)، سيتم تجاهل أي خلايا في الجوار تكون NoData في حساب القيمة الناتجة لخلية المعالجة. عند إلغاء التحديد (ignore_nodata = "NODATA" في Python)، إذا كانت أي خلية في الجوار هي NoData، فإن القيمة الناتجة لخلية المعالجة ستكون NoData.

إذا كانت خلية المعالجة نفسها عبارة عن NoData، فمع تحديد خيار تجاهل NoData في العمليات الحسابية، سيتم حساب القيمة الناتجة للخلية استنادًا إلى الخلايا الأخرى الموجودة في الجوار والتي لها قيمة صالحة. إذا كانت كافة الخلايا الموجودة في الجوار NoData، فسيكون الناتج NoData.

خلايا الزاوية والحافة

عندما تكون خلية المعالجة بالقرب من زوايا وحواف البيانات النقطية المدخلة، يتم ضبط عدد الخلايا المضمنة في الحي وفقًا لذلك. يتم تعديل حساب الإحصائية أيضا.

توضح الرسوم البيانية التالية كيفية حساب الإحصائية الناتجة لكل خلية معالجة من الخلايا المتوفرة في كل جوار على حدة. تبدأ العملية في الزاوية العلوية اليسرى للبيانات النقطية المدخلة وتمسح من اليسار إلى اليمين عبر كل صف قبل المتابعة إلى الصف التالي. الجوار المستخدم في هذا المثال هو مستطيل مكون من 3 × 3 خلايا، والإحصائية المستخدمة هي المجموع. يتم ترك معلمة تجاهل NoData في العمليات الحسابية في الإعداد الافتراضي المحدد. في الرسوم البيانية، يتم تحديد الجوار باللون الأصفر، ويتم تحديد خلية المعالجة باللون السماوي.

بالنسبة لخلية المعالجة الأولى، نظرًا لأنها تقع في الزاوية العلوية اليسرى للبيانات النقطية المدخلة المكونة من 6 × 6 خلايا، فلا يوجد سوى أربع خلايا متاحة في الجوار. تؤدي إضافة هذه القيم معًا إلى تعيين القيمة الناتجة للخلية الأولى بقيمة 11. بالنسبة للخلية التالية على اليمين، يوجد الآن ست خلايا في الجوار، ويتم حساب المجموع لتلك الخلايا. يستمر المسح عبر كافة الخلايا في الصف الأول. لتوفير المساحة، لا يتم عرض كافة خلايا المعالجة.

يتم تمييز الجوار المحيط بكل خلية معالجة للصف الأول من الخلايا المدخلة، فيتم تحديد الخلايا المدخلة التي سيتم استخدامها لحساب قيمة الخلية الناتجة.
يحدد الجوار (المحدد باللون الأصفر) المحيط بكل خلية معالجة (المحددة باللون السماوي) الخلايا المدخلة (بالأعلى) التي سيتم استخدامها في حساب قيمة الإحصائية الناتجة (بالأسفل).

لاحظ أنه في الصف الأول، بالنسبة لخلية المعالجة الثالثة من اليسار (القيمة = 1)، تحتوي إحدى الخلايا المدخلة على قيمة NoData. نظرًا لأنه تم تعيين الأداة لتجاهل NoData، فسيتم تجاهل تلك الخلية بالذات في العمليات الحسابية. إذا تم تعيين الإحصائية المراد حسابها على "المتوسط" بدلاً من "المجموع"، فسيتم حسابها كمجموع كافة الخلايا في الجوار التي ليست NoData، مقسومة على 5.

بالنسبة للصف الثاني من الخلايا المدخلة، سيتم حساب إحصائية خلية المعالجة الأولى بناءً على توفر ست خلايا في الجوار. بالنسبة لخلية المعالجة التالية، سيكون هناك تسع خلايا يجب أخذها في الاعتبار عند الحساب. بالنسبة للخلية التالية، ستكون هناك ثماني قيم مدخلة للحساب باستخدامها، نظرًا لأن إحدى الخلايا الموجودة في الجوار 3 × 3 هي NoData. تستمر العملية لبقية الخلايا في الصف ثم إلى الصفوف التالية حتى يتم تحليل جميع خلايا المعالجة.

يتم عرض معالجة الجوار للصف الثاني في الخلايا المدخلة
يتم تحديد الجوار وخلية المعالجة والقيمة الناتجة لجزء من الصف الثاني للخلايا المدخلة.

حجم الجوار والأداء

يمكن للأداة معالجة مجاورات كبيرة جدًا. ومع ذلك، مع زيادة حجم الجوار، سيتأثر الأداء حيث سيتم تضمين المزيد من الخلايا المدخلة في كل عملية حسابية. يحتوي نوع الجوار المستطيل على بعض التحسينات التي تسمح بزيادة الأداء مقارنة بأشكال الجوار الأخرى لمنطقة معينة.

الحد الأقصى لحجم أي بُعد للجوار يقتصر على 4096 خلية. وهذا يعني أن المجاورات المستطيلة لا يمكن أن تتجاوز هذا العدد من الخلايا سواء في الاتجاه الأفقي أو الرأسي. بالنسبة للمجاورات الدائرية، لا يمكن أن يتجاوز نصف القطر 2047 خلية.

أنواع الجوار

يمكن أن يكون الجوار على شكل حلقة (كعكة)، أو دائرة، أو مستطيل، أو إسفين. باستخدام ملف kernel، يمكنك أيضًا تحديد شكل جوار مخصص، بالإضافة إلى تعيين ترجيحات مختلفة لخلايا معينة في الجوار قبل حساب الإحصائيات.

فيما يلي وصف لأشكال الجوار وكيفية تعريفها:

  • حلقة
    • يتكون شكل الحلقة من دائرتين، إحداهما داخل الأخرى لعمل شكل كعكة. سيتم تضمين الخلايا التي تقع مراكزها خارج نصف قطر الدائرة الأصغر ولكن داخل نصف قطر الدائرة الأكبر في معالجة الجوار. والمنطقة التي تقع بين الدائرتين تشكل جوار الحلقة.
    • يتم تحديد نصف القطر بوحدات الخلايا أو وحدات الخريطة، ويتم قياسه بشكل عمودي على المحور السيني أو الصادي. عندما يتم تحديد نصف القطر بوحدات الخريطة، يتم تحويلها إلى نصف قطر بوحدات الخلية. ينتج نصف القطر الناتج بوحدات الخلية منطقة تمثل بشكل وثيق المنطقة المحسوبة باستخدام نصف القطر الأصلي بوحدات الخريطة. سيتم تضمين أي مركز خلية مشمول بالحلقة في معالجة الجوار.
    • جوار الحلقة الافتراضي هو نصف قطر داخلي لخلية واحدة ونصف قطر خارجي يتكون من ثلاث خلايا.
    • فيما يلي مثال توضيحي لجوار الحلقة:

    خلية معالجة مع جوار الحلقة الافتراضي
    خلية معالجة مع جوار الحلقة الافتراضي (نصف القطر الداخلي = خلية واحدة، نصف القطر الخارجي = 3 خلايا).

  • دائرة
    • يتم إنشاء جوار الدائرة عن طريق تحديد قيمة نصف القطر.
    • يتم تحديد نصف القطر بوحدات الخلايا أو وحدات الخريطة، ويتم قياسه بشكل عمودي على المحور السيني أو الصادي. عند تحديد نصف القطر بوحدات الخريطة، يتم استخدام منطق إضافي لتحديد الخلايا المضمنة في جوار المعالجة. أولاً، يتم حساب المساحة الدقيقة للدائرة المحددة بقيمة نصف القطر المحددة. بعد ذلك، يتم حساب المنطقة لدائرتين إضافيتين، واحدة مع تقريب قيمة نصف القطر المحددة للأقل والأخرى مع تقريب قيمة نصف القطر المحددة للأعلى. تتم مقارنة هاتين المنطقتين بالنتيجة من نصف القطر المحدد، وسيتم استخدام نصف قطر المنطقة الأقرب في العملية.
    • نصف قطر جوار الدائرة الافتراضي هو ثلاث خلايا.
    • فيما يلي مثال توضيحي لجوار دائرة:

    خلية معالجة مع جوار دائري
    خلية معالجة مع جوار دائري (نصف القطر = خليتان).

  • مستطيل
    • يتم تحديد جوار المستطيل من خلال توفير العرض والارتفاع بوحدات الخلايا أو وحدات الخريطة.
    • تتم معالجة الخلايا ذات المراكز التي تقع ضمن الكائن المحدد فقط كجزء من جوار المستطيل.
    • جوار المستطيل الافتراضي هو مربع يبلغ ارتفاعه وعرضه ثلاث خلايا.
    • يتم تحديد موضع x,y لخلية المعالجة داخل الجوار، بالنسبة إلى الزاوية العلوية اليسرى من الجوار، من خلال المعادلات التالية:

      x = (عرض الجوار + 1)/2 y = (ارتفاع الجوار + 1)/2

      إذا كان عدد الخلايا المدخلة زوجيًا، فسيتم حساب إحداثيات x وy باستخدام الاقتطاع. على سبيل المثال، في جوار مكون من 5 × 5 خلايا، تكون قيم x وy هي 3 و3. في جوار مكون من 4 × 4 خلايا، تكون قيم x وy هي 2 و2.

    • فيما يلي أمثلة توضيحية لجوارين مستطيلين:

    خلية معالجة مع اثنين من المجاورات المستطيلة
    خلية معالجة مع مجاورتين مستطيلتين مختلفتين.

  • وتد
    • جوار الإسفين هو جوار على شكل دائري محدد بنصف قطر، وزاوية بداية، وزاوية نهاية.
    • يمتد الوتد عكس عقارب الساعة من زاوية البدء حتى زاوية الانتهاء. يتم تحديد الزوايا بدرجات حسابية من 0 إلى 360، حيث يكون 0 على المحور السيني الموجب (3:00 على مدار الساعة)، ويمكن أن يكون عددًا صحيحًا أو نقطة طافية. من الممكن استخدام الزوايا السالبة.
    • يتم تحديد نصف القطر بوحدات الخلايا أو وحدات الخريطة، ويتم قياسه بشكل عمودي على المحور السيني أو الصادي. عند تحديد نصف القطر بوحدات الخريطة، يتم تحويله إلى نصف قطر بوحدات الخلية. ينتج نصف القطر الناتج بوحدات الخلية منطقة تمثل بشكل وثيق المنطقة المحسوبة باستخدام نصف القطر الأصلي بوحدات الخريطة. سيتم تضمين أي مركز خلية يشمله الإسفين في معالجة الجوار.
    • يتراوح جوار الإسفين الافتراضي من 0 إلى 90 درجة، بنصف قطر مكون من ثلاث خلايا.
    • فيما يلي مثال توضيحي لجوار الإسفين:

    خلية معالجة مع جوار إسفين
    خلية معالجة مع جوار الإسفين الافتراضي (نصف القطر = 3 خلايا، زاوية البداية = 0، زاوية النهاية = 90).

  • غير منتظم
    • يتيح لك ذلك تحديد جوار غير منتظم الشكل حول خلية المعالجة.
    • يحدد ملف kernel غير المنتظم مواضع الخلايا التي سيتم تضمينها داخل الجوار.
    • يتم تحديد موضع x,y لخلية المعالجة داخل الجوار، بالنسبة إلى الزاوية العلوية اليسرى من الجوار، من خلال المعادلات التالية:

      x = (العرض + 1)/2 y = (الارتفاع + 1)/2

      إذا كان عدد الخلايا المدخلة زوجيًا، فسيتم حساب إحداثيات x وy باستخدام الاقتطاع.

    • ينطبق ما يلي على ملف kernel لجوار غير منتظم:

      • ملف kernel غير المنتظم هو ملف نصي ASCII يحدد قيم وشكل الجوار غير المنتظم. يمكن إنشاء الملف باستخدام أي محرر نصوص. يجب أن يكون له امتداد الملف .txt.
      • يحدد السطر الأول عرض الجوار وارتفاعه (عدد الخلايا في الاتجاه x، متبوعًا بمسافة، وعدد الخلايا في الاتجاه y).
      • تحدد الأسطر اللاحقة القيمة التي سيتم استخدامها لكل موضع في الجوار الذي تمثله. من الضروري وضع مسافة بين كل قيمة والأخرى.
      • تحدد القيم ما إذا كان سيتم تضمين موضع في الجوار في الحساب. عادةً، يتم استخدام القيمة 1 لتحديد المواضع التي سيتم تضمينها في الحسابات الخاصة بالجوار غير المنتظم، ولكن يمكن استخدام أي قيمة موجبة أو سالبة بخلاف 0. يمكن أيضًا استخدام قيم النقطة الطافية.
      • لاستبعاد موقع في الجوار من الحساب، استخدم القيمة 0 (وليس مسافة فارغة) في الموقع المقابل في ملف kernel.

    • فيما يلي مثال لملف kernel غير منتظم ASCII والجوار الذي يمثله:

    مثال على kernel غير منتظمة والجوار المرتبط به
    يتم عرض kernel جوار غير منتظم مع رسم توضيحي للخلايا التي سيتم تضمينها للمعالجة.

  • الترجيح
    • على غرار نوع الجوار غير المنتظم، يتيح لك جوار الترجيح تحديد جوار غير منتظم حول خلية المعالجة ولكنه يسمح لك أيضًا بتطبيق الترجيحات على القيم المدخلة.
    • يحدد ملف kernel للترجيح مواضع الخلايا التي سيتم تضمينها داخل الجوار والترجيحات التي سيتم ضربها بها.
    • يتوفر جوار الترجيح فقط لأنواع إحصائيات المتوسط والانحراف المعياري والمجموع.
    • يتم تحديد موضع x,y لخلية المعالجة داخل الجوار، بالنسبة إلى الزاوية العلوية اليسرى من الجوار، من خلال المعادلات التالية:

      x = (العرض + 1)/2 y = (الارتفاع + 1)/2

      إذا كان عدد الخلايا المدخلة زوجيًا، فسيتم حساب إحداثيات x وy باستخدام الاقتطاع.

    • ينطبق ما يلي على ملف kernel الخاص بجوار الترجيح:

      • ملف kernel للترجيح هو ملف نصي ASCII يحدد قيم وشكل جوار الترجيح. يمكن إنشاء الملف باستخدام أي محرر نصوص. يجب أن يكون له امتداد الملف .txt.
      • يحدد السطر الأول عرض الجوار وارتفاعه (عدد الخلايا في الاتجاه x، متبوعًا بمسافة، وعدد الخلايا في الاتجاه y).
      • تحدد الأسطر اللاحقة القيمة التي سيتم استخدامها لكل موضع في الجوار الذي تمثله. من الضروري وضع مسافة بين كل قيمة والأخرى.
      • بالنسبة لإحصائية المجموع، يمكن أن يكون الترجيح أي قيمة موجبة أو سالبة أو عدد صحيح أو قيمة نقطة طافية.
      • بالنسبة لإحصائيات المتوسط والانحراف المعياري، يمكن أن يكون الترجيح أي عدد صحيح موجب أو قيمة نقطة طافية. لا يُسمح بالقيم السالبة لهذه الإحصائيات، لذا سيتم تجاهل أي موضع له ترجيح سلبي في الحسابات.
      • لاستبعاد موقع في الجوار من الحساب، استخدم القيمة 0 (وليس مسافة فارغة) في الموقع المقابل في ملف kernel.

    • فيما يلي مثال لمحتويات ملف kernel المرجح والجوار الذي يمثله:

    مثال على kernel المرجح والجوار المرتبط به
    يتم عرض kernel للجوار المرجح مع رسم توضيحي للخلايا التي سيتم تضمينها للمعالجة.

أنواع الإحصائيات

الإحصائيات المتاحة هي الأغلبية والحد والأقصى والمتوسط والمعدل والحد الأدنى والأقلية والنسبة المئوية والنطاق والانحراف المعياري والمجموع والتنوع. نوع الإحصائيات الافتراضي هو المتوسط.

تتوفر أنواع معينة من الإحصائيات فقط عندما تكون البيانات النقطية المدخلة من نوع العدد الصحيح.

  • الأغلبية
    • يمكن استخدام البيانات النقطية لعدد صحيح فقط كمدخل.
    • يتم تحديد تكرار كل قيمة خلية فريدة في كل جوار. إذا كانت هناك قيمة واحدة لها أعلى تكرار (أكثر قيمة من حيث الظهور)، فسيتم تعيين هذه القيمة لجميع الخلايا الموجودة في هذا الجوار. إذا كان هناك رابط، فسيتم تعيين أقل القيم المرتبطة، ما لم تكن قيمة خلية المعالجة إحدى الروابط. في هذه الحالة، يتم إرجاع القيمة الأصلية لقيمة خلية المعالجة.
  • الحد الأقصى
    • إذا كانت البيانات النقطية المدخلة عددًا صحيحًا، فستكون القيم الموجودة على البيانات النقطية الناتجة عددًا صحيحًا؛ إذا كانت القيم الموجودة في الإدخال عبارة عن نقطة طافية، فستكون القيم الموجودة في الناتج نقطة طافية.
  • المتوسط
    • يمكن أن يكون الإدخال عددًا صحيحًا أو بيانات نقطية طافية.
    • ستكون البيانات النقطية الناتجة دائمًا نقطة طافية.
    • بالنسبة لنوع جوار الترجيح، يعد هذا واحدًا من مجموعة فرعية من أنواع الإحصائيات المدعومة. راجع قسم الجوار المرجح للحصول على تفاصيل حول كيفية حساب هذه الإحصائية.
  • متوسط
    • يمكن أن يكون الإدخال عددًا صحيحًا أو بيانات نقطية طافية.
    • ستكون البيانات النقطية الناتجة دائمًا نقطة طافية.
    • إذا كان هناك عدد فردي من قيم الخلايا الصالحة في الجوار، فسيتم حساب قيمة المتوسط عن طريق ترتيب القيم وتحديد القيمة الوسطى. إذا كان هناك عدد زوجي من القيم في الجوار، فسيتم ترتيب القيم وسيتم حساب متوسط القيمتين الوسطتين.
  • الحد الأدنى
    • إذا كانت البيانات النقطية المدخلة عددًا صحيحًا، فستكون القيم الموجودة على البيانات النقطية الناتجة عددًا صحيحًا؛ إذا كانت القيم الموجودة في الإدخال عبارة عن نقطة طافية، فستكون القيم الموجودة في الناتج نقطة طافية.
  • الأقلية
    • يمكن استخدام البيانات النقطية لعدد صحيح فقط كمدخل.
    • يتم تحديد تكرار كل قيمة خلية فريدة في كل جوار. إذا كانت هناك قيمة واحدة لها أقل تكرار (أقل قيمة من حيث الظهور)، فسيتم تعيين هذه القيمة لجميع الخلايا الموجودة في هذا الجوار. إذا كان هناك رابط، فسيتم تعيين أقل القيم المرتبطة، ما لم تكن قيمة خلية المعالجة إحدى الروابط. في هذه الحالة، يتم إرجاع القيمة الأصلية لقيمة خلية المعالجة.
  • القيمة المئوية
    • يمكن أن يكون الإدخال عددًا صحيحًا أو بيانات نقطية طافية.
    • ستكون البيانات النقطية الناتجة دائمًا نقطة طافية.
    • يتم حساب نتيجة إحصائية القيمة المئوية بناءً على الصيغة التالية (Hyndman and Fan, 1996):
      pk = (k-1)/(n-1)
  • نطاق
    • إذا كانت البيانات النقطية المدخلة عددًا صحيحًا، فستكون القيم الموجودة على البيانات النقطية الناتجة عددًا صحيحًا؛ إذا كانت القيم الموجودة في الإدخال عبارة عن نقطة طافية، فستكون القيم الموجودة في الناتج نقطة طافية.
    • يتم تحديد قيم كل موقع خلية في البيانات النقطية الناتجة على أساس كل خلية على حدة من خلال تطبيق الصيغة: Focal Range = Focal Maximum – Focal Minimum
  • الانحراف المعياري
    • ستكون البيانات النقطية الناتجة دائمًا نقطة طافية.
    • بالنسبة لنوع جوار الترجيح، يعد هذا واحدًا من مجموعة فرعية من أنواع الإحصائيات المدعومة. راجع قسم الجوار المرجح للحصول على تفاصيل حول كيفية حساب هذه الإحصائية.
    • يتم حساب الانحراف المعياري على جميع السكان (الطريقة N)؛ ولا يتم تقديره على أساس العينة (الطريقة N-1).
  • مجموع
    • إذا كانت البيانات النقطية المدخلة عددًا صحيحًا، فستكون القيم الموجودة على البيانات النقطية الناتجة عددًا صحيحًا؛ إذا كانت القيم الموجودة في الإدخال عبارة عن نقطة طافية، فستكون القيم الموجودة في الناتج نقطة طافية.
    • بالنسبة لنوع جوار الترجيح، يعد هذا واحدًا من مجموعة فرعية من أنواع الإحصائيات المدعومة. راجع قسم الجوار المرجح للحصول على تفاصيل حول كيفية حساب هذه الإحصائية.
  • متنوع
    • يمكن استخدام البيانات النقطية لعدد صحيح فقط كمدخل.

عمليات حساب الجوار المرجح

يمكن تعديل مقدار تأثير كل قيمة في الجوار على النتيجة النهائية لخلية المعالجة من خلال تطبيق الترجيحات.

في الأقسام التالية، يتم عرض الصيغ المستخدمة لحساب نتائج إحصائيات المتوسط المرجح والانحراف المعياري والمجموع. يوجد مثال مرفق بكل منها، يوضح الحسابات الخاصة بخلية المعالجة والنتائج الخاصة بجوار مستطيل مكون من 3 × 3 خلايا.

إحصائية المتوسط المرجح

بالنسبة لإحصائية جوار الترجيح مع المتوسط، تكون القيمة الناتجة لخلية المعالجة المركزية هي مجموع حاصل ضرب قيم ترجيح kernel مضروبًا في القيم المدخلة، مقسومًا على مجموع قيم ترجيح kernel.

الصيغة المطبقة على الخلايا داخل الجوار هي كما يلي:

معادلة المتوسط المُرجّح

حيث:

  • µW هي قيمة المتوسط المرجح للسكان لخلية المعالجة.
  • N هو عدد الخلايا في الجوار.
  • wi هي قيمة الترجيح المحددة في kernel.
  • xi هي قيمة الخلية المدخلة.

قديم:

في الإصدارات السابقة، استخدمت الحسابات عدد الخلايا الموجودة في الجوار كمقام.

يجب أن تكون قيم الترجيح قيمًا موجبة ويمكن أن تكون عددًا صحيحًا أو نقطة طافية.

مثال

خذ بعين الاعتبار خلية المعالجة التالية ذات القيمة 7 والأحياء الثمانية المحيطة بها:

4 6 7 6 7 8 4 5 6

المتوسط الحسابي (المجموع/العدد) لهذه القيم هو 53 / 9 = 5.889.

ضع في اعتبارك kernel للخلية المرجحة 3 × 3 التالية:

3 3 0.0 0.5 0.0 0.5 2.0 0.5 0.0 0.5 0.0

تعطي kernel هذه أعلى درجة من التأثير للخلية المركزية (ترجيح 2)، وتقلل من تأثير الأحياء الأربعة المتعامدة على خلية المعالجة (ترجيح 0.5)، وتجعل خلايا الزوايا الأربعة ليس لها أي تأثير (ترجيح 0).

وبتطبيق معادلة المتوسط المرجح المذكورة أعلاه، يبين ما يلي العمليات الحسابية لتحقيق القيمة النهائية.

= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) / (w1 + w2 + w3 + w4 + w5 + w6 + w7 + w8 + w9) = ((0*4)+(0.5*6)+(0*7)+(0.5*6)+(2.0*7)+(0.5*8)+(0*4)+(0.5*5)+(0*6)) / (0+0.5 + 0 + 0.5 + 2.0 + 0.5 + 0 + 0.5 + 0) = (0 + 3.0 + 0 + 3.0 + 14.0 + 4.0 + 0 + 2.5 + 0) / (0.5 + 0.5 + 2.0 + 0.5 + 0.5) = (3.0 + 3.0 + 14.0 + 4.0 + 2.5) / 4.0 = 26.5 / 4.0 = 6.625

للمقارنة، فإن المتوسط العادي للخلايا المدخلة التسع سيكون 5.889. إذا تم تضمين الخلايا المدخلة الخمس الموجودة داخل kernel فقط (حيث الترجيح ! = 0) ولكن مع عدم أخذ قيم الترجيحات في الاعتبار، فسيكون المتوسط 6.4 (6 + 6 + 7 + 8 + 5 = 32، وهو الناتج عندما تتم القسمة على العد خمسة).

إحصائية الانحراف المعياري المرجح

بالنسبة لإحصائية جوار الترجيح مع الانحراف المعياري، تكون القيمة الناتجة لخلية المعالجة هي ناتج المعادلة التالية:

معادلة الانحراف المعياري المُرجّح

حيث:

  • SDW هي قيمة الانحراف المعياري المرجح للسكان لخلية المعالجة.
  • µW هي قيمة المتوسط المرجح للسكان لخلية المعالجة.
  • N هو عدد الخلايا في الجوار.
  • wi هي قيمة الترجيح المحددة في kernel.
  • xi هي قيمة الخلية المدخلة.

يجب أن تكون قيم الترجيح قيمًا موجبة ويمكن أن تكون عددًا صحيحًا أو نقطة طافية.

إذا كانت جميع القيم المدخلة في الجوار متماثلة، فستكون قيمة الانحراف المعياري لخلية المعالجة هذه 0.

مثال

سيتم استخدام نفس قيم الجوار التي تم استخدامها في مثال المتوسط المرجح أعلاه مرة أخرى في هذا المثال.

4 6 7 6 7 8 4 5 6

سيتم أيضًا استخدام نفس قيم النواة المرجحة:

3 3 0.0 0.5 0.0 0.5 2.0 0.5 0.0 0.5 0.0

وبتطبيق معادلة الانحراف المعياري المرجح المذكورة أعلاه لخلية المعالجة المركزية ذات القيمة 7، فإن نتيجة حساب الانحراف المعياري المرجح هي 0.85696 تقريبًا.

إحصائية المجموع المرجح

بالنسبة لإحصائية الجوار المرجح مع المجموع، تكون القيمة الناتجة لخلية المعالجة هي ناتج المعادلة التالية:

معادلة المجموع المرجح

حيث:

  • SW هي قيمة المجموع المرجح لخلية المعالجة.
  • N هو عدد الخلايا في الجوار.
  • wi هي قيمة الترجيح المحددة في kernel.
  • xi هي قيمة الخلية المدخلة.

يمكن أن تكون قيم الترجيح قيمًا موجبة أو سالبة ويمكن أن تكون عددًا صحيحًا أو نقطة طافية.

مثال

ضع في اعتبارك قيم الجوار المدخلة التالية:

4 6 7 6 7 8 4 5 6

ضع في اعتبارك kernel للخلية المرجحة 3 × 3 التالية:

3 3 -1 -2 -1 0 0 0 1 2 1

وبتطبيق المعادلة المذكورة أعلاه، يوضح ما يلي العمليات الحسابية المستخدمة لتحقيق القيمة النهائية:

= (w1x1 + w2x2 + w3x3 + w4x4 + w5x5 + w6x6 + w7x7 + w8x8 + w9x9) = ((-1*4) + (-2*6) + (-1*7) + (0*6) + (0*7) + (0*8) + (1*4) + (2*5) + (1*6)) = (-4) + (-12) + (-7) + 4 + 10 + 6 = -3

‏‏مراجع

  • Hyndman, R.J. and Y. Fan, November 1996. "Sample Quantiles in Statistical Packages." The American Statistician 50 (4): 361-365.