تحسب أداة حساب الكثافة كثافة kernel للمعالم في المنطقة المحيطة بتلك المعالم. يمكن حسابها لكل من المعالم النقطية والخطية.
تشمل الاستخدامات المحتملة تحليل كثافة المساكن أو حدوث الجريمة لأغراض التخطيط المجتمعي أو استكشاف كيفية تأثير الطرق أو خطوط المرافق على موائل الحياة البرية. يمكن استخدام حقل التعبئة لترجيح بعض المعالم بشكل أكبر من غيرها أو السماح لنقطة واحدة بتمثيل عدة ملاحظات. على سبيل المثال، قد يمثل عنوان واحد عمارات مكونة من ست وحدات، أو قد يتم ترجيح بعض الجرائم بشكل أكبر من غيرها في تحديد مستويات الجريمة الإجمالية. بالنسبة إلى المعالم الخطية، قد يكون للطريق السريع المقسم تأثير أكبر من تأثير طريق ترابي ضيق.
كيف يتم حساب كثافة النواة
يتم حساب كثافة النواة بشكل مختلف للمعالم المختلفة.
معالم النقطة
تقوم كثافة النواة بحساب كثافة المعالم النقطية حول كل خلية بيانات نقطية ناتجة.
من الناحية النظرية، يتم تثبيت سطح منحني أملس فوق كل نقطة. تكون قيمة السطح هي الأعلى في موقع النقطة وتقل مع زيادة المسافة من النقطة، لتصل إلى الصفر عند مسافة نطاق البحث من النقطة. الحي الدائري هو الممكن فقط. الحجم الموجود أسفل السطح يساوي قيمة حقل التعبئة للنقطة، أو 1 إذا تم تحديد NONE. يتم حساب الكثافة في كل خلية نقطية ناتجة عن طريق إضافة قيم جميع أسطح النواة التي تتداخل فيها مع مركز خلية البيانات النقطية. تعتمد دالة النواة على دالة النواة الرباعية الموضحة في Silverman (1986، ص 76، المعادلة 4.5).
إذا تم استخدام إعداد حقل تعبئة بخلاف NONE، فإن قيمة كل عنصر تحدد عدد مرات حساب النقطة. على سبيل المثال، ستؤدي القيمة 3 إلى احتساب النقطة على أنها ثلاث نقاط. يمكن أن تكون القيم عددًا صحيحًا أو فاصلة عائمة.
بشكل افتراضي، يتم تحديد الوحدة بناءً على الوحدة الخطية لتعريف الإسقاط لبيانات معلم نقطة الإدخال أو كما هو محدد في إعداد بيئة النظام الإحداثي الناتج.
إذا تم تحديد عامل وحدات منطقة الإخراج، يتم ضرب الكثافة المحسوبة للخلية بالعامل المناسب قبل كتابتها إلى البيانات النقطية للإخراج. على سبيل المثال، إذا كانت وحدات الإدخال بالأمتار، فستتحول وحدات منطقة الإخراج افتراضيًا إلى كيلومتر مربع. النتيجة النهائية لمقارنة عامل مقياس وحدة أمتار إلى كيلومترات ستؤدي إلى اختلاف القيم بمضاعف 1000000 (1000 متر × 1000 متر).
المعالم الخطية
يمكن لأداة حساب الكثافة حساب كثافة المعالم الخطية أيضًا في الجوار لكل خلية بيانات نقطية ناتجة.
من الناحية المفاهيمية، يتم تركيب سطح منحني بسلاسة فوق كل خط. تكون قيمتها أكبر على الخط وتقل عندما تبتعد عن الخط، لتصل إلى الصفر عند مسافة نطاق البحث المحددة من الخط. يتم تعريف السطح بحيث يساوي الحجم الموجود تحت السطح ناتج طول الخط وقيمة حقل التعبئة. يتم حساب الكثافة في كل خلية نقطية ناتجة عن طريق إضافة قيم جميع أسطح النواة التي تتداخل فيها مع مركز خلية البيانات النقطية. يتم تكييف استخدام دالة النواة للخطوط من دالة النواة الرباعية لكثافات النقاط كما هو موصوف في Silverman (1986, p. 76, equation 4.5).
يوضح الرسم التوضيحي أعلاه مقطعًا خطيًا وسطح النواة مثبتًا فوقه. مساهمة المقطع الخطي في الكثافة تساوي قيمة سطح النواة في مركز خلية البيانات النقطية.
بشكل افتراضي، يتم تحديد الوحدة بناءً على الوحدة الخطية لتعريف الإسقاط لبيانات معلم الخطوط المتجاورة للإدخال أو كما هو محدد بطريقة أخرى في إعداد بيئة النظام الإحداثي الناتج.
عند تحديد عامل وحدات منطقة الإخراج، فإنه يحول وحدات الطول والمساحة. على سبيل المثال، إذا كانت وحدات الإدخال بالأمتار، فستتحول وحدات منطقة الإخراج افتراضيًا إلى كيلومتر مربع وستتحول وحدات كثافة الخطوط الناتجة إلى كيلومترات لكل كيلومتر مربع. ستكون النتيجة النهائية، بمقارنة عامل مقياس الوحدة من أمتار إلى كيلومترات، أن تصبح قيم الكثافة مختلفة بمضاعف 1000.
يمكنك التحكم في وحدات الكثافة لكل من المعالم النقطية والخطية عن طريق تحديد العامل المناسب يدويًا. لضبط الكثافة بالمتر لكل متر مربع (بدلاً من الكيلومترات الافتراضية لكل كيلومتر مربع)، اضبط وحدات المساحة على متر مربع. وبالمثل، للحصول على وحدات الكثافة الخاصة بالناتج بالأميال لكل ميل مربع، اضبط وحدات المساحة على أميال مربعة.
إذا تم استخدام حقل محتوى بخلاف NONE، فسيتم اعتبار طول السطر هو طوله الفعلي مضروبًا في قيمة حقل المحتوى لهذا السطر.
صيغ لحساب كثافة النواة
تحدد الصيغ التالية كيفية حساب كثافة النواة للنقاط وكيف يتم تحديد نطاق البحث الافتراضي ضمن صيغة كثافة النواة.
توقع كثافة النقاط
يتم تحديد الكثافة المتوقعة في موقع (x،y) جديد بالصيغة التالية:
حيث:
- i = 1,…,n هي نقاط الإدخال. قم بتضمين النقاط في المجموع فقط إذا كانت ضمن مسافة نصف قطر الموقع (x،y).
- popi هي قيمة حقل المحتوى للنقطة i، وهي معلمة اختيارية.
- disti هي المسافة بين النقطة i والموقع (x،y).
ثم يتم ضرب الكثافة المحسوبة في عدد النقاط أو مجموع حقل المحتوى إذا تم توفير واحد. يجعل هذا التصحيح التكامل المكاني مساويًا لعدد النقاط (أو المجموع أو حقل المحتوى) بدلاً من أن يكون دائمًا مساويًا لـ 1. يستخدم هذا التطبيق نواة Quartic (Silverman, 1986). يجب حساب الصيغة لكل موقع تريد تقدير الكثافة فيه. نظرًا لأنه يتم إنشاء بيانات نقطية، يتم تطبيق العمليات الحسابية على مركز كل خلية في البيانات النقطية الناتجة.
نطاق البحث الافتراضي (النطاق الترددي)
الخوارزمية المستخدمة لتحديد نطاق البحث الافتراضي، والمعروف أيضًا باسم النطاق الترددي، تقوم بما يلي:
- تحسب متوسط مركز نقاط الإدخال. إذا تم توفير حقل محتوى، فسيتم ترجيح هذا الحقل وجميع العمليات الحسابية التالية بالقيم الموجودة في هذا الحقل.
- تحسب المسافة من مركز المتوسط (المرجح) لجميع النقاط.
- تحسب الوسيط (المرجح) لهذه المسافات، Dm.
- تحسب المسافة القياسية (المرجحة)، SD.
- تطبق الصيغة التالية لحساب النطاق الترددي.
حيث:
- Dm هو متوسط المسافة (المرجحة) من متوسط المركز (المرجح).
- n هو عدد النقاط إذا لم يتم استخدام حقل محتوى، أو إذا تم توفير حقل محتوى، فإن n هي مجموع قيم حقل المحتوى.
- SD هي المسافة القياسية.
لاحظ أن جزء min للمعادلة يعني أنه سيتم استخدام أي من الخيارين، إما SD أو ، الذي ينتج عنه قيمة أصغر.
هناك طريقتان لحساب المسافة القياسية، غير المرجحة والمرجحة.
المسافة غير المرجحة
حيث:
- x i و y i و z i هي إحداثيات المعلم i
- {x̄، ȳ، z̄} تمثل متوسط المركز للمعالم
- n يساوي العدد الإجمالي للمعالم.
المسافة المرجحة
حيث:
- wi هو الترجيح في المعلم i
- {x w، y w، z w} تمثل مركز المتوسط المُرجّح.
الميثودولوجيا (علم المنهج)
تعتمد هذه المنهجية لاختيار نطاق البحث على صيغة قاعدة الإبهام لـ Silverman لتقدير عرض النطاق الترددي، ولكن تم تكييفها لبعدين. يتجنب هذا المنهج لحساب نصف القطر الافتراضي عمومًا الحلقة حول ظاهرة النقاط التي تحدث غالبًا مع مجموعة بيانات متفرقة ويكون مقاومًا للقيم المتطرفة المكانية — بضع نقاط بعيدة عن بقية النقاط.
كيف يؤثر الحاجز على حساب الكثافة
يغير الحاجز تأثير المعلم أثناء حساب كثافة النواة لخلية في البيانات النقطية الناتجة. يمكن أن يكون الحاجز عبارة عن طبقة معالم متعددة الخطوط أو مضلع. ويمكن أن يؤثر على حساب الكثافة بطريقتين، إما عن طريق زيادة المسافة بين العلموالخلية التي يتم حساب الكثافة فيها أو استبعاد معلم من الحساب.
بدون حاجز، تكون المسافة بين المعلم والخلية هي أقصر مسافة ممكنة، أي أنها خط مستقيم بين نقطتين. مع وجود حاجز مفتوح، عادةً ما يتم تمثيله بخط متعدد الخطوط، يتأثر المسار بين المعلم والخلية بالحاجز. في هذه الحالة، يتم تمديد المسافة بين المعلم والخلية بسبب التفاف حول الحاجز، كما هو موضح في الرسم التوضيحي أدناه. نتيجة لذلك، يتم تقليل تأثير المعلم أثناء تقدير الكثافة في الخلية. يتم إنشاء المسار حول الحاجز عن طريق توصيل سلسلة من الخطوط المستقيمة للالتفاف حول الحاجز من معلم نقطة الإدخال إلى الخلية. لا تزال أقصر مسافة حول الحاجز ولكنها أطول من المسافة بدون الحاجز. مع وجود حاجز مغلق، يتم تمثيله عادةً بواسطة مضلع يشتمل تمامًا على بعض المعالم، فإن حساب الكثافة في خلية على جانب واحد من الحاجز يستبعد تمامًا المعالم الموجودة على الجانب الآخر من الحاجز.
يمكن لعملية كثافة النواة باستخدام الحاجز أن توفر نتائج أكثر واقعية ودقة في بعض المواقف مقارنة بعملية كثافة النواة بدون الحاجز. على سبيل المثال، عند استكشاف كثافة توزيع أنواع البرمائيات، قد يؤثر وجود جرف أو طريق على حركتها. يمكن استخدام الجرف أو الطريق كحاجز للحصول على تقدير أفضل للكثافة. وبالمثل، قد تختلف نتيجة تحليل الكثافة لمعدل الجريمة في مدينة ما إذا تم اعتبار النهر الذي يمر عبر المدينة بمثابة حاجز.
يوضح الرسم التوضيحي أدناه ناتج كثافة النواة لحوادث المرور في وقت متأخر من الليل في لوس أنجلوس (تتوفر البيانات من بوابة بيانات نظم المعلومات الجغرافية في مقاطعة لوس أنجلوس). يوجد تقدير الكثافة بدون حاجز على اليسار (1) مع وجود حاجز على جانبي الطريق على اليمين (2). توفر الأداة تقديرًا أفضل للكثافة باستخدام الحاجز، حيث يتم قياس المسافة إضافة إلى شبكة الطرق، بدلاً من استخدام أقصر مسافة بين مواقع الحوادث.
مراجع
Silverman, Bernard W. 1986. Density Estimation for Statistics and Data Analysis. New York: Chapman and Hall.