• +90 537 656 74 31
  • [email protected]
CONTACT US
تواصل معنا
  • English
  • دراسات السوق
    • دراسة الجدوى الاقتصادية
    • منصة متابعة العمل التفاعلية
    • الدراسات التسويقية
    • تطوير المنتجات
    • دراسة رضا العملاء
    • اختبار تجربة العميل
  • المراقبة والتقييم
    • تطوير السياسات وأدلة الإجراءات
    • التقييم النهائي
    • تقييم الاحتياجات الإنسانية
    • تحليل الأثر
    • تقييم السوق
    • المراقبة كطرف ثالث (TPM)
    • التحقق من قوائم المستفيدين
  • الأبحاث السياسية والاجتماعية
    • تطوير المؤشرات
    • تطوير المقاييس
    • استطلاعات الرأي
    • الشراكات البحثية
    • الاختبارات الإحصائية للأبحاث
  • تدريبات
  • الأجندة
    • دراسات بحثية
    • الأدلة
    • التقارير التفاعلية
    • الأخبار
    • الاسئلة المتكررة
  • حول اندكيتورز
إستشارة مجانية

طلب إستشارة مجانية

    معلومات التواصل

    İncilipınar Mah, Nail Bilen cd, Kantar İş Merkezi, kat 4, ofis 404, Şehitkamil, Gaziantep, Turkey

    +90 537 656 74 31

    [email protected]

    24/7 دعم

    Unlimited help desk

    Menu
    • English
    معالجة القيم الشاذة

    معالجة القيم الشاذة

    هناك من لا يضع للقيم الشاذة أو Outliers أي اعتبار عند عمله في تحليل البيانات، وقد يكون سمع بهذا المصطلح وهو يقرأ هذه الأسطر. القيم الشاذة لها تأثير كبير على الكثير من المؤشرات الإحصائية، وأساليب التعامل معها ومعالجتها تتعلق بعوامل كثيرة منها ما هو بسيط ومنها ما يكون أكثر تعقيدا يتعلق بنوع المؤشر الإحصائي، إذ يجب على محلل البيانات معرفة تصنيف المعامل الإحصائي Smooth Prameter أم لا، وهذا ما يعبر عن درجة تأثره بالقيم الشاذة.

    مثلاً المتوسط الحسابي يعتبر من أفضل مؤشرات/معاملات النزعة المركزية إلا أنه يتأثر بالقيم الشاذة بدرجة كبيرة جداً مقارنة بالوسيط، علماً أن الوسيط لا يعتبر معاملاً دقيقاً مقارنة بالمتوسط الحسابي.

    سأحاول في هذه الأسطر الحديث عن جانب هام وهو الأكثر بساطة وهو أساليب معالجة القيم الشاذة.

    أساليب معالجة القيم الشاذة:
    1. مراجعة المصدر: للتحقق من القيمة فإن كان هناك خطأ في الإدخال يتم تصحيحه، كأن يكتب العمر لدراسة للأطفال 22 خطأ بدل 2، بذلك نكتشف ببساطة أنه خطأ في الإدخال ونصححه.
    2. المعالجة المنطقية للقيم الشاذة: يمكن اكتشاف أخطاء القيم الشاذة من خلال المعالجة المنطقية، ببساطة عند دراسة للقوى العاملة فإن من يكون عمره 7 سنين مثلا سيتم حذف بياناته لأنه لا يصنف من القوى العاملة.
    3. التمييز بين ما نبقيه وما نحذفه: تعتبر هذه العملية مرهقة جداً، إذ لا توجد معايير دقيقة لأجل قبول أو رفض القيم الشاذة، وفي هذا الجانب يقدم برنامج SPSS ميزة جميلة، هي تصنيف القيم الشاذة إلى نوعين، قيم شاذة Outliers (التي توجد بين الربيع الأول/الثالث وواحد ونصف المدى البيعي) وقيم متطرفة Extreme values (التي تبعد ما بين واحد ونصف إلى ثلاثة مرات المدى الربيعي)، أي باختصار بيانات بعيدة عن مكان تمركز البيانات وبيانات بعيدة جداً عنه، في هذه الحالة يمكن اعتماد هذا التصنيف بقبول القيم الشاذة وحذف القيم المتطرفة.
    4. استبدال القيم الشاذة التي تم حذفها: الخطوة الأخيرة والأكثر حساسية هي قرار التعامل مع ما تم حذفه من قيم شاذة، هل نقوم بإبقائها محذوفة أم نستبدلها، يبدأ التحدي من قرار الاستبدال، إذ أن تركها فارغة يترتب عليه تبعات وتحديات ومقابله فإن استبدالها يترتب عليه أيضاً تبعات وتحديات. يتبع اتخاذ قرار الاستبدال هو المنهجية المناسبة للاستبدال، فعملية استبدال القيم المفقودة معقدة أيضاً فلها منهجيات وخيارات مختلفة، كل من هذه المنهجيات سيكون له تأثير بطريقة ما على نتائج تحليل البيانات (سأتحدث عن استبدال القيم المفقودة في منشور آخر إن شاء الله).

    ليس من البساطة اجمال منهجيات التعامل مع القيم الشاذة بهذه الأسطر القليلة، فحذف القيم الشاذة يضعنا في خيارات أخرى، هل نترك مكانها كقيمة مفقودة أم نستبدلها بقيم بديلة، كما أننا عندما نحذف القيم الشاذة ونعيد استكشاف البيانات نجد أن هناك قيم شاذة جديدة قد ظهرت، كانت هذه القيم لا تعتبر شاذة باعتبار قاعدة البيانات قبل تعديلها (أي قبل حذف القيم الشاذة في المرحلة الأولى)، لذلك أنصح بالتبحر بهذا المجال، مع مراعاة كم الإغراق بالتبحر بناء على حجم البيانات ودرجة حساسيتها.

    بواسطة:
    غيث البحر: الرئيس التنفيذي لشركة إنديكيتورز

    مشاركة
    • الوصف
    • مراجعات (0)
    الوصف

    هناك من لا يضع للقيم الشاذة أو Outliers أي اعتبار عند عمله في تحليل البيانات، وقد يكون سمع بهذا المصطلح وهو يقرأ هذه الأسطر. القيم الشاذة لها تأثير كبير على الكثير من المؤشرات الإحصائية، وأساليب التعامل معها ومعالجتها تتعلق بعوامل كثيرة منها ما هو بسيط ومنها ما يكون أكثر تعقيدا يتعلق بنوع المؤشر الإحصائي، إذ يجب على محلل البيانات معرفة تصنيف المعامل الإحصائي Smooth Prameter أم لا، وهذا ما يعبر عن درجة تأثره بالقيم الشاذة.
    مثلاً المتوسط الحسابي يعتبر من أفضل مؤشرات/معاملات النزعة المركزية إلا أنه يتأثر بالقيم الشاذة بدرجة كبيرة جداً مقارنة بالوسيط، علماً أن الوسيط لا يعتبر معاملاً دقيقاً مقارنة بالمتوسط الحسابي.
    سأحاول في هذه الأسطر الحديث عن جانب هام وهو الأكثر بساطة وهو أساليب معالجة القيم الشاذة.
    أساليب معالجة القيم الشاذة:
    1. مراجعة المصدر: للتحقق من القيمة فإن كان هناك خطأ في الإدخال يتم تصحيحه، كأن يكتب العمر لدراسة للأطفال 22 خطأ بدل 2، بذلك نكتشف ببساطة أنه خطأ في الإدخال ونصححه.
    2. المعالجة المنطقية للقيم الشاذة: يمكن اكتشاف أخطاء القيم الشاذة من خلال المعالجة المنطقية، ببساطة عند دراسة للقوى العاملة فإن من يكون عمره 7 سنين مثلا سيتم حذف بياناته لأنه لا يصنف من القوى العاملة.
    3. التمييز بين ما نبقيه وما نحذفه: تعتبر هذه العملية مرهقة جداً، إذ لا توجد معايير دقيقة لأجل قبول أو رفض القيم الشاذة، وفي هذا الجانب يقدم برنامج SPSS ميزة جميلة، هي تصنيف القيم الشاذة إلى نوعين، قيم شاذة Outliers (التي توجد بين الربيع الأول/الثالث وواحد ونصف المدى البيعي) وقيم متطرفة Extreme values (التي تبعد ما بين واحد ونصف إلى ثلاثة مرات المدى الربيعي)، أي باختصار بيانات بعيدة عن مكان تمركز البيانات وبيانات بعيدة جداً عنه، في هذه الحالة يمكن اعتماد هذا التصنيف بقبول القيم الشاذة وحذف القيم المتطرفة.
    4. استبدال القيم الشاذة التي تم حذفها: الخطوة الأخيرة والأكثر حساسية هي قرار التعامل مع ما تم حذفه من قيم شاذة، هل نقوم بإبقائها محذوفة أم نستبدلها، يبدأ التحدي من قرار الاستبدال، إذ أن تركها فارغة يترتب عليه تبعات وتحديات ومقابله فإن استبدالها يترتب عليه أيضاً تبعات وتحديات. يتبع اتخاذ قرار الاستبدال هو المنهجية المناسبة للاستبدال، فعملية استبدال القيم المفقودة معقدة أيضاً فلها منهجيات وخيارات مختلفة، كل من هذه المنهجيات سيكون له تأثير بطريقة ما على نتائج تحليل البيانات (سأتحدث عن استبدال القيم المفقودة في منشور آخر إن شاء الله).
    ليس من البساطة اجمال منهجيات التعامل مع القيم الشاذة بهذه الأسطر القليلة، فحذف القيم الشاذة يضعنا في خيارات أخرى، هل نترك مكانها كقيمة مفقودة أم نستبدلها بقيم بديلة، كما أننا عندما نحذف القيم الشاذة ونعيد استكشاف البيانات نجد أن هناك قيم شاذة جديدة قد ظهرت، كانت هذه القيم لا تعتبر شاذة باعتبار قاعدة البيانات قبل تعديلها (أي قبل حذف القيم الشاذة في المرحلة الأولى)، لذلك أنصح بالتبحر بهذا المجال، مع مراعاة كم الإغراق بالتبحر بناء على حجم البيانات ودرجة حساسيتها.
    غيث البحر

    مراجعات (0)

    المراجعات

    لا توجد مراجعات بعد.

    كن أول من يقيم “معالجة القيم الشاذة” إلغاء الرد

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    منتجات ذات صلة

    احتياجات ذوي الإعاقة
    Close

    احتياجات ذوي الإعاقة، غازي عنتاب

    Published on: 2019-07-01نُشِرَ بتاريخ: 2019-07-01
    تقييم القدرات لأقسام المراقبة والتقييم في المنظمات السورية
    Close

    تقييم القدرات لأقسام المراقبة والتقييم في المنظمات السورية

    Published on: 2022-03-15نُشِرَ بتاريخ: 2022-03-15
    اختبار تجربة العميل
    Close

    اختبار تجربة العميل

    Published on: 2022-03-05نُشِرَ بتاريخ: 2022-03-05
    كيف يرى الناشطون السوريون دستور بلادهم المستقبلي
    Close

    كيف يرى الناشطون السوريون دستور بلادهم المستقبلي

    Published on: 2021-03-01نُشِرَ بتاريخ: 2021-03-01
    دراسة اندماج النازحين والمجتمع المحلي في مدينة إدلب
    Close

    دراسة اندماج النازحين والمجتمع المحلي في مدينة إدلب

    Published on: 2019-04-01نُشِرَ بتاريخ: 2019-04-01
    تشغيل السوريين عبر الانترنت
    Close

    العمل عبر الانترنت للسوريين

    Published on: 2018-04-01نُشِرَ بتاريخ: 2018-04-01
    تأثير مستوى اللغة التركية على اندماج السوريين
    Close

    تأثير مستوى اللغة التركية على اندماج السوريين

    Published on: 2022-02-07نُشِرَ بتاريخ: 2022-02-07
    مؤشر الحوكمة الدولي عام 2018
    Close

    مؤشر الحوكمة الدولي عام 2018

    Published on: 2018-12-07نُشِرَ بتاريخ: 2018-12-07

    تواصل معنا

    البريد الإلكتروني

    [email protected]
    راسلنا

    هاتف

    (0090) 537 656 74 31

    واتساب

    WhatsApp

    تابعنا عبر:

    اندكيتورز

    كيان بحثي متخصص في التحليل الإحصائي ومعالجة البيانات يقدم خدمات في أبحاث السوق ودراسات الجدوى ، TPM ، استطلاعات الرأي ، والبحوث الاجتماعية.
    • الأجندة
      • دراسات بحثية
      • الأدلة
      • التقارير التفاعلية
      • الأخبار
      • الاسئلة المتكررة
    • قطاع الأعمال
      • دراسة الجدوى الاقتصادية
      • منصة متابعة العمل التفاعلية
      • الدراسات التسويقية
      • تطوير المنتجات
      • عرض المزيد
    • القطاع الإنساني
      • تطوير السياسات وأدلة الإجراءات
      • التقييم النهائي
      • تقييم الاحتياجات الإنسانية
      • تحليل الأثر
      • عرض المزيد
    • قطاع الأبحاث
      • تطوير المؤشرات
      • تطوير المقاييس
      • استطلاعات الرأي
      • الشراكات البحثية
      • الاختبارات الإحصائية للأبحاث
    صنع بـ ❤ بواسطة فواز العباس

    كافة الحقوق محفوظة 2021-2022. اندكيتورز ©

    • دراسات السوق
      • دراسة الجدوى الاقتصادية
      • منصة متابعة العمل التفاعلية
      • الدراسات التسويقية
      • تطوير المنتجات
      • دراسة رضا العملاء
      • اختبار تجربة العميل
    • المراقبة والتقييم
      • تطوير السياسات وأدلة الإجراءات
      • التقييم النهائي
      • تقييم الاحتياجات الإنسانية
      • تحليل الأثر
      • تقييم السوق
      • المراقبة كطرف ثالث (TPM)
      • التحقق من قوائم المستفيدين
    • الأبحاث السياسية والاجتماعية
      • تطوير المؤشرات
      • تطوير المقاييس
      • استطلاعات الرأي
      • الشراكات البحثية
      • الاختبارات الإحصائية للأبحاث
    • تدريبات
    • الأجندة
      • دراسات بحثية
      • الأدلة
      • التقارير التفاعلية
      • الأخبار
      • الاسئلة المتكررة
    • حول اندكيتورز
    Start typing to see posts you are looking for.