ملاحظة:
هندسة البيانات متوفرة في Insights desktop. كل مستخدمي Insights in ArcGIS Online وInsights in ArcGIS Enterprise لديهم حق الوصول إلى Insights desktop. لمزيد من المعلومات، راجع مقدمة عن ArcGIS Insights.
هندسة البيانات قيد المعاينة حاليًا.
يتم تطبيق الأدوات من قائمة خيارات الاستيراد على مجموعات البيانات عند إضافتها إلى مصنف البيانات، ولكن لا تتم إضافتها إلى نموذج البيانات.
أدوات الاستيراد
تتوفر الأدوات التالية عند استيراد مجموعة بيانات إلى مصنف البيانات:
أداة | الوصف |
---|---|
طبق عامل تصفية متقدمًا على مجموعة البيانات وحدد الحقول المراد تضمينها في عينة مجموعة البيانات. | |
اقتطاع المسافات الفارغة | إزالة المسافات الفارغة من بداية ونهاية قيم السلسلة. يتم تمكين هذه الأداة بشكل افتراضي. |
اختر كيفية إنشاء عينة مجموعة البيانات. هذه الأداة متاحة لمجموعات البيانات التي تحتوي على أكثر من 250000 سجل. |
استخدام خيارات الاستيراد
أكمل الخطوات التالية لتطبيق أدوات الاستيراد على مجموعة بيانات:
- افتح نافذة إضافة إلى صفحة بتنفيذ أحد ما يلي:
- قم بإنشاء مصنف بيانات. تظهر نافذة إضافة إلى صفحة عند إنشاء مصنف البيانات.
- انقر فوق الزر إضافة إلى صفحة أعلى جزء البيانات في مصنف البيانات الموجود.
- حدد مجموعة بيانات لإضافتها إلى مصنف البيانات.
- انقر فوق زر خيارات الاستيراد للقيام بما يلي:
- اختر تصفية مجموعة البيانات لتطبيق عامل تصفية متقدم وحدد الحقول المراد تضمينها في عينة مجموعة البيانات.
- اختر ما إذا كنت تريد قطع المسافات الفارغة من بداية ونهاية السلاسل (ممكّن بشكل افتراضي).
- إذا كانت مجموعة البيانات تحتوي على أكثر من 250000 سجل، فاختر ما إذا كنت تريد استخدام طريقة أخذ العينات العشوائية (الافتراضية) أو الثابتة.
- انقر على إضافة.
طرق أخذ العينات
هناك طريقتان لإنشاء عينات البيانات: عشوائية وثابتة.
عشوائي
تحدد طريقة أخذ العينات العشوائية 250000 سجل بصورة عشوائية من مجموعة البيانات. من المحتمل أن تنشئ هذه الطريقة عينة تمثيلية للقيم الفريدة ونطاقات الأرقام. ومع ذلك، قد لا يتم اختيار القيم ذات التكرارات القليلة نسبيًا في العينة. على سبيل المثال ، الخطأ المطبعي في عمود السلسلة والذي يظهر مرة واحدة فقط قد لا يتم تحديده في العينة العشوائية، لذلك لن تعرف كيفية إصلاح الخطأ المطبعي كجزء من سير عمل هندسة البيانات.
الطريقة العشوائية هي طريقة أخذ العينات المفضلة لمعظم مجموعات البيانات.
ملاحظة:
يجب أن تحتوي موصلات قاعدة البيانات غير الجاهزة للاستخدام على ملفات تكوين محدثة لدعم أخذ العينات العشوائية. إذا كنت لا تستخدم أحدث ملفات التكوين للموصل، فيجب عليك إزالة نوع الموصل الموجود وإعادة إضافة الموصل بأحدث الملفات.
اتصالات البيانات فقط بـ ArcGIS Enterprise لا تدعم أخذ العينات العشوائية إذا لم يتم تثبيت Insights 2022.2 أو إصدار أحدث في المؤسسة.
قد لا يتم دعم أخذ العينات العشوائية للبيانات من علامتي التبويب Living Atlas وArcGIS العام.
ثابت
تحدد الطريقة الثابتة السجلات بالترتيب الذي تظهر به في مجموعة البيانات. حجم العينة الافتراضي هو 250000 سجل، ولكن يمكنك زيادة حجم العينة أو تقليله عند استيراد مجموعة البيانات.
استخدم الطريقة الثابتة عندما تريد زيادة حجم العينة، أو عندما يكون لديك مجموعة بيانات ستوفر عينة تمثيلية باستخدام السجلات بالترتيب الذي تظهر به.
لا تستخدم الطريقة الثابتة لمجموعات البيانات المرتبة بطريقة تؤثر على وجود القيم في العينة. على سبيل المثال، تحتوي مجموعة البيانات على بيانات الطقس لعدة سنوات عبر بلد ما، ولكن أول 250000 سجل لا تتضمن سوى الشهرين الأولين من البيانات. في هذه الحالة، لن تكون البيانات ممثلة للتواريخ ودرجات الحرارة وكميات هطول الأمطار والأحوال الجوية الأخرى المسجلة في مجموعة البيانات الكاملة.