ما هو استيفاء كريغنغ بايز التجريبي؟

استيفاء كريغنغ بايز التجريبي (EBK) هو طريقة استيفاء إحصائي جغرافي تعمل على أتمتة الجوانب الأكثر صعوبة في بناء نموذج كريغنغ صالح. تتطلب منك طرق كريغنغ الأخرى في Geostatistical Analyst ضبط المعلمات يدويًا للحصول على نتائج دقيقة، ولكن EBK يحسب هذه المعلمات تلقائيًا من خلال عملية تقليل الحجم والمحاكاة.

يختلف استيفاء كريغنغ بايز التجريبي أيضًا عن طرق كريغنغ الأخرى من خلال تفسير الخطأ الذي تم تقديمه عن طريق تقدير سيميفاريوغرام الأساسي. تحسب طرق كريغنغ الأخرى سيميفاريوغرام من مواقع البيانات المعروفة وتستخدم سيميفاريوغرام المفرد هذا لعمل تنبؤات في مواقع غير معروفة؛ تفترض هذه العملية ضمنيًا أن سيميفاريوغرام المقدر هو سيميفاريوغرام الحقيقي لمنطقة الاستيفاء. من خلال استبعاد عدم التأكد من تقدير سيميفاريوغرام، فإن طرق كريغنغ الأخرى تقلل من الأخطاء القياسية للتنبؤ.

يتم تقديم استيفاء كريغنغ بايز التجريبي في معالج الإحصائيات الجغرافية وفي صورة أداة معالجة جغرافية.

المزايا والعيوب

استيفاء كريغنغ بايز التجريبي له عدد من المزايا والعيوب مقارنة بطرق الاستيفاء الأخرى.

المميزات

  • يتطلب الحد الأدنى من النمذجة التفاعلية.
  • الأخطاء القياسية للتنبؤ أكثر دقة من طرق كريغنغ الأخرى.
  • يسمح بالتنبؤات الدقيقة للبيانات غير الثابتة إلى حد ما.
  • أكثر دقة من طرق كريغنغ الأخرى لمجموعات البيانات الصغيرة.

العيوب

  • يزداد وقت المعالجة بسرعة مع زيادة عدد نقاط الإدخال أو حجم المجموعة الفرعية أو عامل التداخل. سيؤدي تطبيق التحويل أيضًا إلى زيادة وقت المعالجة، خاصةً إذا تم اختيار K-Bessel أو K-Bessel Detrended لنوع نموذج سيميفاريوغرام. يتم وصف هذه المعلمات في الأقسام اللاحقة من هذا الموضوع.
  • تكون المعالجة أبطأ من طرق كريغنغ الأخرى، خاصةً عند الإخراج إلى بيانات نقطية.
  • كو كريغنغ والتصحيحات متباينة الخواص غير متوفرة.
  • يعتبر التحويل التجريبي اللوغاريتمي حساسًا بشكل خاص للقيم المتطرفة. إذا كنت تستخدم هذا التحويل مع البيانات التي تحتوي على قيم متطرفة، فقد تحصل على تنبؤات بأحجام أكبر أو أصغر من قيم نقاط الإدخال الخاصة بك. تم وصف هذه المعلمة في قسم عمليات التحويل أدناه.

تقدير سيميفاريوغرام

على عكس طرق كريغنغ الأخرى (التي تستخدم المربعات الصغرى المرجحة)، يتم تقدير معلمات سيميفاريوغرام في استيفاء EBK باستخدام الحد الأقصى من الاحتمالية المقيدة (REML). بسبب للقيود الحسابية لـ REML لمجموعات البيانات الضخمة، يتم أولاً تقسيم البيانات المدخلة إلى مجموعات فرعية متداخلة ذات حجم محدد (افتراضيًا إلى 100 نقطة لكل مجموعة فرعية). في كل مجموعة فرعية، يتم تقدير عدد السيميفيوغرامات بالطريقة التالية:

  1. يتم تقدير سيميفاريوغرام من البيانات الموجودة في المجموعة الفرعية.
  2. باستخدام سيميفاريوغرام هذا كنموذج، تتم محاكاة البيانات الجديدة دون قيد أو شرط في كل موقع من المواقع المدخلة في المجموعة الفرعية.
  3. يتم تقدير سيميفاريوغرام جديد من بيانات المحاكاة.
  4. يتم تكرار الخطوتين 2 و3 لعدد محدد من المرات. في كل تكرار، يتم استخدام سيميفاريوغرام المقدر في الخطوة 1 لمحاكاة مجموعة جديدة من البيانات في المواقع المدخلة، ويتم استخدام البيانات المحاكاة لتقدير سيميفاريوغرام جديد.

تُنشئ هذه العملية عددًا كبيرًا من السيميفيوغرامات لكل مجموعة فرعية، وعندما يتم رسمها معًا، تكون النتيجة توزيعًا تجريبيًا للسيميفيوغرامات المظللة بالكثافة (كلما كان اللون الأزرق أغمق، كلما مر عدد أكبر من السيميفيوغرامات عبر تلك المنطقة). يتم تمثيل أشباه التباينات التجريبية بصلبان زرقاء. بالإضافة إلى ذلك، يتم تلوين متوسط التوزيع بخط أحمر متصل، ويتم تلوين النسب المئوية 25 و75 بخطوط حمراء متقطعة، كما هو موضح أدناه.

السيميفيوغرامات التي تمت محاكاتها
يتم عرض السيميفيوغرامات التي تمت محاكاتها لمجموعة فرعية واحدة.

يتم تعيين عدد السيميفيوغرامات التي تمت محاكاتها لكل مجموعة فرعية افتراضيًا إلى 100، وكل من هذه السيميفيوغرامات عبارة عن تقدير للسيميفاريوغرام الحقيقي للمجموعة الفرعية.

لكل موقع من مواقع التنبؤ، يتم حساب التنبؤ باستخدام توزيع سيميفاريوغرام تجريبي يتم إنشاؤه عن طريق دمج السيميفيوغرامات الفردية من توزيعات سيميفاريوغرام في المنطقة المجاورة للنقطة. على سبيل المثال، إذا كان موقع التنبؤ يحتوي على جيران في ثلاث مجموعات فرعية (كما هو محدد بواسطة البحث في الجوار)، فسيتم حساب التوقع باستخدام السيميفيوغرامات التي تمت مُحاكاتها من كل مجموعة من المجموعات الفرعية الثلاث. يتم ترجيح مخططات السيميفيوغرامات من كل مجموعة فرعية بعدد الجيران الذين يساهمون في التنبؤ. يسمح هذا للمجموعات الفرعية التي تساهم بمزيد من الجيران بالتأثير بشكل أكبر على القيمة المتوقعة.

عندما يتم تنفيذ استيفاء كريغنغ بايز التجريبي في معالج الإحصاء الجغرافي، ستتمكن من رؤية المجموعات الفرعية التي تم استخدامها لحساب القيمة المتوقعة. في الصورة أدناه، موقع التنبؤ هو مركز الشعيرات المتصالبة على سطح المعاينة. الدائرة الصغيرة حول الشعيرات المتصالبة هي منطقة البحث، ويظهر المضلعان الكبيران المتداخلان النقاط الموجودة في المجموعتين الفرعيتين اللتين تم استخدامهما لحساب التنبؤ. في هذا المثال، يتم تضمين النقاط الموجودة في منتصف الخريطة في كلتا المجموعتين الفرعيتين. يمكنك تشغيل وإيقاف تشغيل تصورات المضلعات هذه باستخدام الزر المشار إليه بالسهم:

التنبؤ بمجموعات فرعية
يتم إنشاء التنبؤات من المجموعات الفرعية المجاورة.

نموذج كريغنغ

يختلف استيفاء كريغنغ بايز التجريبي عن طرق كريغنغ الأخرى في Geostatistical Analyst باستخدام دالة عشوائية جوهرية كنموذج كريغنغ.

تفترض نماذج كريغنغ الأخرى أن العملية تتبع متوسطًا عامًا (أو اتجاهًا محددًا) مع اختلافات فردية حول هذا المتوسط. يتم سحب الانحرافات الكبيرة نحو الوسط، لذلك لا تنحرف القيم كثيرًا أبدًا. ومع ذلك، لا يفترض استيفاء EBK ميلًا نحو متوسط عام، لذلك من المرجح أن تزداد الانحرافات الكبيرة بقدر احتمال أن تصبح أصغر. ومن ثم، فإن الدوال العشوائية الجوهرية صحيحة بطبيعتها للاتجاهات في البيانات.

نموذج سيميفاريوغرام

لمسافة معينة h، يدعم استيفاء كريغنغ بايز التجريبي السيميفيوغرامات التالية:

  • قوة
    • γ(h)= الكتلة + b|h|α
  • خطي
    • γ(h)= الكتلة + b|h|
  • شريحة Thin Plate
    • γ(h)= الكتلة + b|h2|*ln(|h|)

يجب أن تكون الكتلة وb (المنحدر) موجبة، ويجب أن تكون α (القوة) بين 0.25 و1.75. في ظل هذه القيود، يتم تقدير المعلمات باستخدام REML. لا تحتوي نماذج سيميفاريوغرام هذه على نطاق أو معلمة حافة لأن الدوال ليس لها حد أعلى.

في استيفاء EBK، من الممكن تحليل التوزيع التجريبي لتقديرات المعلمات لأن العديد من السيميفيوغرامات يتم تقديرها في كل موقع. يؤدي النقر فوق علامة التبويب الكتلة أو المنحدر أو الطاقة إلى عرض توزيعات المعلمات المرتبطة. يوضح الرسم التالي توزيعات معلمات سيميفاريوغرام لمحاكاة السيميفيوغرامات الموضحة في الرسم السابق:

يتم عرض توزيعات الكتلة والمنحدر والقوة
توزيعات الكتلة والمنحدر والقوة

من خلال النقر فوق موقع مختلف على سطح المعاينة، يتم عرض توزيع سيميفاريوغرام وتوزيعات معلمات سيميفاريوغرام للموقع الجديد. إذا لم تتغير التوزيعات بشكل كبير عبر مجال البيانات، فهذا يشير إلى أن البيانات ثابتة بشكل عام. يجب أن تتغير التوزيعات بسلاسة عبر مجال البيانات؛ ومع ذلك، إذا رأيت تغييرات كبيرة في التوزيعات عبر مسافات صغيرة، فإن زيادة قيمة عامل التداخل يمكن أن يسهّل انتقالات التوزيعات.

ملاحظة:‏

كما هو موضح في قسم عمليات التحويل أدناه، يؤدي تطبيق التحويل إلى تغيير نموذج كريغنغ من دالة عشوائية جوهرية إلى نموذج كريغنغ بسيط، وتتوفر العديد من نماذج سيميفاريوغرام الإضافية.

عمليات التحويل

يوفر استيفاء كريغنغ بايز التجريبي التحريف المضاعف تحويل النقاط العادي مع اختيار توزيعين أساسيين: تجريبي ولوغاريتمي تجريبي. يتطلب التحويل اللوغاريتمي التجريبي أن تكون جميع قيم البيانات موجبة، وسيضمن أن تكون جميع التوقعات موجبة. هذا مناسب لبيانات مثل هطول الأمطار التي لا يمكن أن تكون سالبة.

إذا تم تطبيق التحويل، يتم استخدام نموذج كريغنغ بسيط بدلاً من دالة عشوائية جوهرية. بسبب هذه التغييرات، تتغير توزيعات المعلمات إلى الكتلة والحافة الجزئية والنطاق.

إذا تم اختيار K-Bessel أو K-Bessel Detrended لنوع سيميفاريوغرام، فسيتم عرض رسم بياني إضافي لمعلمة الشكل في K-Bessel. تظهر أيضًا علامة تبويب التحويل الإضافية وتعرض توزيع عمليات التحويل المجهزة (واحدة لكل محاكاة). كما هو الحال مع علامة تبويب السيميفيوغرامات، يتم تلوين توزيع التحويل حسب الكثافة، ويتم توفير خطوط مجموعة أعداد متساوية.

يتم عرض توزيعات الكتلة، والحافة الجزئية، والمدى، والتحويل.
توزيعات الكتلة، والحافة الجزئية، والمدى، والتحويل.

السيميفيوغرامات

تفترض جميع الأساليب الإحصائية الجغرافية وجود ارتباط تلقائي مكاني، وأن الأشياء الأقرب تكون أكثر تشابهًا من الأشياء الأبعد، ويحدد سيميفاريوغرام كيف يتضاءل هذا التشابه عبر المسافة. تفترض بعض السيميفيوغرامات (الأسية، على سبيل المثال) أن التشابه يتضاءل بسرعة. من ناحية أخرى، يفترض نموذج سيميفاريوغرام Whittle أن التشابه يتضاءل ببطء. حتى مع نفس الكتلة، والمدى، والحافة، فإن هذين السيميفيوغرامين سيحددان تناقص التشابه بطرق مختلفة تمامًا. مفتاح الحصول على نتائج موثوقة هو اختيار سيميفاريوغرام يتطابق بشكل وثيق مع سلوك ظاهرتك. تعتمد نماذج سيميفاريوغرام المتاحة لك على اختيارك لنموذج سيميفاريوغرام.

إذا تم تعيين التحويل على بدون، فإن نماذج سيميفاريوغرام التالية تكون متاحة:

  • الطاقة (افتراضي)
  • خطي
  • شريحة Thin Plate

إذا تم تعيين التحويل على تجريبي أو لوغاريتمي تجريبي، فستتوفر نماذج سيميفاريوغرام التالية:

  • أسي (افتراضي)
  • متذبذب أسي
  • Whittle
  • Whittle متذبذب
  • K-Bessel
  • متذبذب K-Bessel

نماذج سيميفاريوغرام المتذبذب الثلاثة هي نفسها نظيراتها غير المتذبذبة، باستثناء أنه سيتم تطبيق إزالة الاتجاه من الدرجة الأولى. إزالة الاتجاه له تأثير ضئيل على سرعة الحساب.

مزايا وعيوب كل نموذج

كل سيميفاريوغرام له مزايا وعيوب. عند اختيار سيميفاريوغرام، يجب مراعاة وقت الحساب ومرونة النموذج (القدرة على استيعاب نطاق واسع من مجموعات البيانات بدقة):

  • قوة
    • المزايا: سريع ومرن نسبيًا. بشكل عام خيار آمن يوازن بين الأداء والدقة.
    • العيوب: أقل مرونة وأبطأ من الخيارات الأخرى.
  • خطي
    • المزايا: سريع جدا.
    • العيوب: نموذج أقل مرونة.
  • شريحة Thin Plate
    • المزايا: سريع جدا. يعمل بشكل أفضل عندما تكون الاتجاهات القوية موجودة.
    • العيوب: أقل مرونة، خاصة عند عدم وجود اتجاه.
  • أسي
    • المزايا: يقدم تحولًا مرنًا. أسرع من K-Bessel و K-Bessel المتذبذب.
    • العيوب: شكل سيميفاريوغرام غير مرن. بطيء مقارنة بالقوة، والخطية، وشريحة Thin Plate.
  • أسي غير متجه
    • المزايا: يقدم تحولًا مرنًا. أسرع من K-Bessel و K-Bessel المتذبذب. يزيل اتجاه الطلب الأول.
    • العيوب: شكل سيميفاريوغرام غير مرن. بطيء مقارنة بالقوة، والخطية، وشريحة Thin Plate.
  • Whittle
    • المزايا: يقدم تحولًا مرنًا. أسرع من K-Bessel و K-Bessel المتذبذب.
    • العيوب: شكل سيميفاريوغرام غير مرن. بطيء مقارنة بالقوة، والخطية، وشريحة Thin Plate.
  • Whittle متذبذب
    • المزايا: يقدم تحولًا مرنًا. أسرع من K-Bessel و K-Bessel المتذبذب. يزيل اتجاه الطلب الأول.
    • العيوب: شكل سيميفاريوغرام غير مرن. بطيء مقارنة بالقوة، والخطية، وشريحة Thin Plate.
  • K-Bessel
    • المزايا: الأكثر مرونة ودقة.
    • العيوب: يستغرق أطول وقت للحساب.
  • متذبذب K-Bessel
    • المزايا: الأكثر مرونة ودقة. يزيل اتجاه الطلب الأول.
    • العيوب: يستغرق أطول وقت للحساب.

اختيار سيميفاريوغرام

يجب أن يكون اختيار سيميفاريوغرام واضحًا في معظم الأوقات، بناءً على المعايير التالية:

  • إذا كنت على استعداد للانتظار للحصول على أكثر النتائج دقة، فيجب اختيار K-Bessel أو K-Bessel المتذبذب. يجب أن يحدد وجود الاتجاه أو عدم وجوده استخدام أيهما.
  • إذا كنت بحاجة إلى نتائج سريعة وكنت على استعداد للتنازل عن بعض الدقة، فيجب اختيار شريحة Linear أو Thin Plate. إذا لم يكن هناك اتجاه أو كان الاتجاه ضعيفًا، فإن Linear هو الخيار الأفضل.
  • إذا كنت بحاجة إلى توازن بين الدقة والسرعة، فإن الطاقة خيار جيد.
  • إذا كان التحويل مطلوبًا، ولكن لا يمكنك الانتظار لفترة طويلة للإخراج، فيجب اختيار أسي أو Whittle (أو نظرائهم المتذبذبة). يجب عليك اختيار النموذج الذي يتطابق بشكل أفضل مع أشباه التباينات التجريبية في معالج الإحصاء الجغرافي (الموصوف أدناه). يجب أيضًا أخذ التحقق المتقاطع في الاعتبار.

إذا كنت تحاول الاختيار بين الأسي، وWhittle، ونظرائهم المتذبذبة، فيجب عليك اختيار سيميفاريوغرام الذي يوفر أفضل ملاءمة بصرية لأشباه التباينات التجريبية (التقاطعات الزرقاء في الرسومات أدناه). بصورة مثالية، يجب أن تقع أشباه التباينات التجريبية في منتصف طيف سيميفاريوغرام. على سبيل المثال، في الرسم التالي، لا تقع الصلبان الزرقاء في منتصف طيف شبه مخطط (معظمها يقع في الجزء العلوي من الطيف):

لا تقع أشباه التباينات التجريبية في منتصف الطيف.
لا تقع أشباه التباينات التجريبية في منتصف الطيف.

بدلاً من ذلك، يجب تفضيل سيميفاريوغرام التالي لأن الصلبان الزرقاء تقع في منتصف طيف سيميفاريوغرام:

تقع أشباه التباينات التجريبية في منتصف الطيف.
تقع أشباه التباينات التجريبية في منتصف الطيف.

حسابات المسافة للبيانات في الإحداثيات الجغرافية

إذا كانت البيانات المدخلة في نظام إحداثيات جغرافي، فسيتم حساب المسافات باستخدام المسافة الوترية. المسافة الوترية بين أي نقطتين هي المسافة المستقيمة التي تربط النقطتين. سيمر هذا الخط عبر الأرض وليس بطول سطحها. لتصور هذا، تخيل تسليط مصباح يدوي عبر كرة شفافة. طول شعاع الضوء بين النقطة التي يدخل فيها الضوء والتي يخرج فيها من الكرة هو المسافة الوترية بين هاتين النقطتين. الفائدة الأساسية لاستخدام المسافة الوترية على المسافة الجيوديسية هي أنها أقل كثافة من الناحية الحسابية. بالإضافة إلى ذلك، هناك نظرية محدودة فقط حول أداء كريغنغ على الأجسام شبه الكروية.

ملاحظة:‏

نظرًا لأن المسافات الوترية ليست تقديرات تقريبية جيدة للمسافات الجيوديسية للمسافات التي تزيد عن 30 درجة عشرية، فلا يمكن أن يتجاوز نصف قطر البحث 15 درجة عشرية (وبالتالي، لا يمكن أن يتجاوز القطر 30 درجة)، وأي موقع ليس له أي جيران ضمن 15 درجة عشرية سوف يُحسب على أنه NoData. بالإضافة إلى ذلك، تتطلب بعض نماذج سيميفاريوغرام تثبيت مستوى مسطح لكل مجموعة فرعية لإجراء إزالة الاتجاه. لا يمكن إنشاء هذا المستوى بدقة للمجموعات الفرعية التي يتجاوز مداها 30 درجة عشرية، لذلك يقتصر مدى المجموعات الفرعية الفردية على 30 درجة لنماذج سيميفاريوغرام التالية:

  • شريحة Thin Plate
  • أسي غير متجه
  • Whittle متذبذب
  • متذبذب K-Bessel

تعاملت الإصدارات السابقة من ArcGIS مع الإحداثيات الجغرافية على أنها إحداثيات مربعة وحسبت المسافة الإقليدية بين النقاط. ومع ذلك، فإن الخلية التي تبلغ درجة واحدة في درجة واحدة ليست مربعًا في الواقع، لذلك سيتم تشويه هذه المسافة. يزداد هذا التشوه سوءًا كلما تحركت بعيدًا شمالًا أو جنوبًا من خط الاستواء.

معلمات إضافية لاستيفاء كريغنغ بايز التجريبي

يستخدم استيفاء كريغنغ بايز التجريبي ثلاث معاملات لا تظهر في طرق كريغنغ الأخرى:

  • الحد الأقصى لعدد النقاط في كل نموذج محلي — يحدد عدد النقاط في كل مجموعة فرعية. كلما كان حجم المجموعة الفرعية أكبر، كلما استغرق حساب EBK وقتًا أطول.
  • عامل تداخل مساحة النموذج المحلي — يحدد درجة التداخل بين المجموعات الفرعية. يمكن أن تقع كل نقطة إدخال في عدة مجموعات فرعية، ويحدد عامل التداخل متوسط عدد المجموعات الفرعية الذي ستقع فيه كل نقطة. على سبيل المثال، يعني عامل التداخل البالغ 1.5 أنه سيتم استخدام حوالي نصف النقاط في مجموعة فرعية واحدة وسيتم استخدام نصفها في مجموعتين فرعيتين. إن القيمة الأعلى لعامل التداخل تجعل السطح الناتج أكثر سلاسة، ولكنها تزيد أيضًا من وقت المعالجة.
  • عدد السيميفيوغرامات التي تمت محاكاتها — يحدد عدد السيميفيوغرامات التي ستتم محاكاتها لكل مجموعة فرعية. سيؤدي المزيد من عمليات المحاكاة إلى جعل التنبؤات أكثر دقة، لكن وقت المعالجة سيزداد أيضًا.

‏‏مراجع

  • Chilès, J-P., and P. Delfiner (1999). Chapter 4 of Geostatistics: Modeling Spatial Uncertainty. New York: John Wiley & Sons, Inc.
  • Krivoruchko K. (2012). "Empirical Bayesian Kriging," ArcUser Fall 2012.
  • Krivoruchko K. (2012). "Modeling Contamination Using Empirical Bayesian Kriging," ArcUser Fall 2012.
  • Krivoruchko K. and Gribov A. (2014). "Pragmatic Bayesian kriging for non-stationary and moderately non-Gaussian data," Mathematics of Planet Earth. Proceedings of the 15th Annual Conference of the International Association for Mathematical Geosciences, Springer 2014, pp. 61-64.
  • Krivoruchko K. and Gribov A. (2019). "Evaluation of empirical Bayesian kriging," Spatial Statistics Volume 32. https://doi.org/10.1016/j.spasta.2019.100368.
  • Pilz, J., and G. Spöck (2007). "Why Do We Need and How Should We Implement Bayesian Kriging Methods," Stochastic Environmental Research and Risk Assessment 22 (5):621–632.