• +90 537 656 74 31
  • [email protected]
CONTACT US
تواصل معنا
  • English
  • دراسات السوق
    • دراسة الجدوى الاقتصادية
    • منصة متابعة العمل التفاعلية
    • الدراسات التسويقية
    • تطوير المنتجات
    • دراسة رضا العملاء
    • اختبار تجربة العميل
  • المراقبة والتقييم
    • تطوير السياسات وأدلة الإجراءات
    • التقييم النهائي
    • تقييم الاحتياجات الإنسانية
    • تحليل الأثر
    • تقييم السوق
    • المراقبة كطرف ثالث (TPM)
    • التحقق من قوائم المستفيدين
  • الأبحاث السياسية والاجتماعية
    • تطوير المؤشرات
    • تطوير المقاييس
    • استطلاعات الرأي
    • الشراكات البحثية
    • الاختبارات الإحصائية للأبحاث
  • تدريبات
  • الأجندة
    • دراسات بحثية
    • الأدلة
    • التقارير التفاعلية
    • الأخبار
    • الاسئلة المتكررة
  • حول اندكيتورز
إستشارة مجانية

طلب إستشارة مجانية

    معلومات التواصل

    İncilipınar Mah, Nail Bilen cd, Kantar İş Merkezi, kat 4, ofis 404, Şehitkamil, Gaziantep, Turkey

    +90 537 656 74 31

    [email protected]

    24/7 دعم

    Unlimited help desk

    Menu
    • English
    معالجة القيم الشاذة

    معالجة القيم الشاذة

    هناك من لا يضع للقيم الشاذة أو Outliers أي اعتبار عند عمله في تحليل البيانات، وقد يكون سمع بهذا المصطلح وهو يقرأ هذه الأسطر. القيم الشاذة لها تأثير كبير على الكثير من المؤشرات الإحصائية، وأساليب التعامل معها ومعالجتها تتعلق بعوامل كثيرة منها ما هو بسيط ومنها ما يكون أكثر تعقيدا يتعلق بنوع المؤشر الإحصائي، إذ يجب على محلل البيانات معرفة تصنيف المعامل الإحصائي Smooth Prameter أم لا، وهذا ما يعبر عن درجة تأثره بالقيم الشاذة.

    مثلاً المتوسط الحسابي يعتبر من أفضل مؤشرات/معاملات النزعة المركزية إلا أنه يتأثر بالقيم الشاذة بدرجة كبيرة جداً مقارنة بالوسيط، علماً أن الوسيط لا يعتبر معاملاً دقيقاً مقارنة بالمتوسط الحسابي.

    سأحاول في هذه الأسطر الحديث عن جانب هام وهو الأكثر بساطة وهو أساليب معالجة القيم الشاذة.

    أساليب معالجة القيم الشاذة:
    1. مراجعة المصدر: للتحقق من القيمة فإن كان هناك خطأ في الإدخال يتم تصحيحه، كأن يكتب العمر لدراسة للأطفال 22 خطأ بدل 2، بذلك نكتشف ببساطة أنه خطأ في الإدخال ونصححه.
    2. المعالجة المنطقية للقيم الشاذة: يمكن اكتشاف أخطاء القيم الشاذة من خلال المعالجة المنطقية، ببساطة عند دراسة للقوى العاملة فإن من يكون عمره 7 سنين مثلا سيتم حذف بياناته لأنه لا يصنف من القوى العاملة.
    3. التمييز بين ما نبقيه وما نحذفه: تعتبر هذه العملية مرهقة جداً، إذ لا توجد معايير دقيقة لأجل قبول أو رفض القيم الشاذة، وفي هذا الجانب يقدم برنامج SPSS ميزة جميلة، هي تصنيف القيم الشاذة إلى نوعين، قيم شاذة Outliers (التي توجد بين الربيع الأول/الثالث وواحد ونصف المدى البيعي) وقيم متطرفة Extreme values (التي تبعد ما بين واحد ونصف إلى ثلاثة مرات المدى الربيعي)، أي باختصار بيانات بعيدة عن مكان تمركز البيانات وبيانات بعيدة جداً عنه، في هذه الحالة يمكن اعتماد هذا التصنيف بقبول القيم الشاذة وحذف القيم المتطرفة.
    4. استبدال القيم الشاذة التي تم حذفها: الخطوة الأخيرة والأكثر حساسية هي قرار التعامل مع ما تم حذفه من قيم شاذة، هل نقوم بإبقائها محذوفة أم نستبدلها، يبدأ التحدي من قرار الاستبدال، إذ أن تركها فارغة يترتب عليه تبعات وتحديات ومقابله فإن استبدالها يترتب عليه أيضاً تبعات وتحديات. يتبع اتخاذ قرار الاستبدال هو المنهجية المناسبة للاستبدال، فعملية استبدال القيم المفقودة معقدة أيضاً فلها منهجيات وخيارات مختلفة، كل من هذه المنهجيات سيكون له تأثير بطريقة ما على نتائج تحليل البيانات (سأتحدث عن استبدال القيم المفقودة في منشور آخر إن شاء الله).

    ليس من البساطة اجمال منهجيات التعامل مع القيم الشاذة بهذه الأسطر القليلة، فحذف القيم الشاذة يضعنا في خيارات أخرى، هل نترك مكانها كقيمة مفقودة أم نستبدلها بقيم بديلة، كما أننا عندما نحذف القيم الشاذة ونعيد استكشاف البيانات نجد أن هناك قيم شاذة جديدة قد ظهرت، كانت هذه القيم لا تعتبر شاذة باعتبار قاعدة البيانات قبل تعديلها (أي قبل حذف القيم الشاذة في المرحلة الأولى)، لذلك أنصح بالتبحر بهذا المجال، مع مراعاة كم الإغراق بالتبحر بناء على حجم البيانات ودرجة حساسيتها.

    بواسطة:
    غيث البحر: الرئيس التنفيذي لشركة إنديكيتورز

    Share
    • Description
    • Reviews (0)
    Description

    هناك من لا يضع للقيم الشاذة أو Outliers أي اعتبار عند عمله في تحليل البيانات، وقد يكون سمع بهذا المصطلح وهو يقرأ هذه الأسطر. القيم الشاذة لها تأثير كبير على الكثير من المؤشرات الإحصائية، وأساليب التعامل معها ومعالجتها تتعلق بعوامل كثيرة منها ما هو بسيط ومنها ما يكون أكثر تعقيدا يتعلق بنوع المؤشر الإحصائي، إذ يجب على محلل البيانات معرفة تصنيف المعامل الإحصائي Smooth Prameter أم لا، وهذا ما يعبر عن درجة تأثره بالقيم الشاذة.
    مثلاً المتوسط الحسابي يعتبر من أفضل مؤشرات/معاملات النزعة المركزية إلا أنه يتأثر بالقيم الشاذة بدرجة كبيرة جداً مقارنة بالوسيط، علماً أن الوسيط لا يعتبر معاملاً دقيقاً مقارنة بالمتوسط الحسابي.
    سأحاول في هذه الأسطر الحديث عن جانب هام وهو الأكثر بساطة وهو أساليب معالجة القيم الشاذة.
    أساليب معالجة القيم الشاذة:
    1. مراجعة المصدر: للتحقق من القيمة فإن كان هناك خطأ في الإدخال يتم تصحيحه، كأن يكتب العمر لدراسة للأطفال 22 خطأ بدل 2، بذلك نكتشف ببساطة أنه خطأ في الإدخال ونصححه.
    2. المعالجة المنطقية للقيم الشاذة: يمكن اكتشاف أخطاء القيم الشاذة من خلال المعالجة المنطقية، ببساطة عند دراسة للقوى العاملة فإن من يكون عمره 7 سنين مثلا سيتم حذف بياناته لأنه لا يصنف من القوى العاملة.
    3. التمييز بين ما نبقيه وما نحذفه: تعتبر هذه العملية مرهقة جداً، إذ لا توجد معايير دقيقة لأجل قبول أو رفض القيم الشاذة، وفي هذا الجانب يقدم برنامج SPSS ميزة جميلة، هي تصنيف القيم الشاذة إلى نوعين، قيم شاذة Outliers (التي توجد بين الربيع الأول/الثالث وواحد ونصف المدى البيعي) وقيم متطرفة Extreme values (التي تبعد ما بين واحد ونصف إلى ثلاثة مرات المدى الربيعي)، أي باختصار بيانات بعيدة عن مكان تمركز البيانات وبيانات بعيدة جداً عنه، في هذه الحالة يمكن اعتماد هذا التصنيف بقبول القيم الشاذة وحذف القيم المتطرفة.
    4. استبدال القيم الشاذة التي تم حذفها: الخطوة الأخيرة والأكثر حساسية هي قرار التعامل مع ما تم حذفه من قيم شاذة، هل نقوم بإبقائها محذوفة أم نستبدلها، يبدأ التحدي من قرار الاستبدال، إذ أن تركها فارغة يترتب عليه تبعات وتحديات ومقابله فإن استبدالها يترتب عليه أيضاً تبعات وتحديات. يتبع اتخاذ قرار الاستبدال هو المنهجية المناسبة للاستبدال، فعملية استبدال القيم المفقودة معقدة أيضاً فلها منهجيات وخيارات مختلفة، كل من هذه المنهجيات سيكون له تأثير بطريقة ما على نتائج تحليل البيانات (سأتحدث عن استبدال القيم المفقودة في منشور آخر إن شاء الله).
    ليس من البساطة اجمال منهجيات التعامل مع القيم الشاذة بهذه الأسطر القليلة، فحذف القيم الشاذة يضعنا في خيارات أخرى، هل نترك مكانها كقيمة مفقودة أم نستبدلها بقيم بديلة، كما أننا عندما نحذف القيم الشاذة ونعيد استكشاف البيانات نجد أن هناك قيم شاذة جديدة قد ظهرت، كانت هذه القيم لا تعتبر شاذة باعتبار قاعدة البيانات قبل تعديلها (أي قبل حذف القيم الشاذة في المرحلة الأولى)، لذلك أنصح بالتبحر بهذا المجال، مع مراعاة كم الإغراق بالتبحر بناء على حجم البيانات ودرجة حساسيتها.
    غيث البحر

    Reviews (0)

    Reviews

    There are no reviews yet.

    Be the first to review “معالجة القيم الشاذة” إلغاء الرد

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    Related products

    الملاحظة
    Close

    الملاحظة – ابطال الميدان 4

    Published on: 2018-11-04نُشِرَ بتاريخ: 2018-11-04
    تشغيل السوريين عبر الانترنت
    Close

    العمل عبر الانترنت للسوريين

    Published on: 2018-04-01نُشِرَ بتاريخ: 2018-04-01
    البيانات عديمة الفائدة
    Close

    البيانات عديمة الفائدة

    Published on: 2022-05-23نُشِرَ بتاريخ: 2022-05-23
    منصة متابعة العمل
    Close

    منصة متابعة العمل

    Published on: 2021-12-09نُشِرَ بتاريخ: 2021-12-09
    البطالة في السعودية
    Close

    البطالة في السعودية

    Published on: 2021-10-20نُشِرَ بتاريخ: 2021-10-20
    اختبار تجربة العميل
    Close

    اختبار تجربة العميل

    Published on: 2022-03-05نُشِرَ بتاريخ: 2022-03-05
    اخلاقيات جمع البيانات
    Close

    ابطال الميدان 1 – اخلاقيات جمع البيانات

    Published on: 2018-11-01نُشِرَ بتاريخ: 2018-11-01
    تشغيل السوريين عبر الانترنت
    Close

    العمل عبر الانترنت للسوريين

    Published on: 2018-01-01نُشِرَ بتاريخ: 2018-01-01

    تواصل معنا

    البريد الإلكتروني

    [email protected]
    راسلنا

    هاتف

    (0090) 537 656 74 31

    واتساب

    WhatsApp

    تابعنا عبر:

    اندكيتورز

    كيان بحثي متخصص في التحليل الإحصائي ومعالجة البيانات يقدم خدمات في أبحاث السوق ودراسات الجدوى ، TPM ، استطلاعات الرأي ، والبحوث الاجتماعية.
    • الأجندة
      • دراسات بحثية
      • الأدلة
      • التقارير التفاعلية
      • الأخبار
      • الاسئلة المتكررة
    • قطاع الأعمال
      • دراسة الجدوى الاقتصادية
      • منصة متابعة العمل التفاعلية
      • الدراسات التسويقية
      • تطوير المنتجات
      • عرض المزيد
    • القطاع الإنساني
      • تطوير السياسات وأدلة الإجراءات
      • التقييم النهائي
      • تقييم الاحتياجات الإنسانية
      • تحليل الأثر
      • عرض المزيد
    • قطاع الأبحاث
      • تطوير المؤشرات
      • تطوير المقاييس
      • استطلاعات الرأي
      • الشراكات البحثية
      • الاختبارات الإحصائية للأبحاث
    صنع بـ ❤ بواسطة فواز العباس

    كافة الحقوق محفوظة 2021-2022. اندكيتورز ©

    • دراسات السوق
      • دراسة الجدوى الاقتصادية
      • منصة متابعة العمل التفاعلية
      • الدراسات التسويقية
      • تطوير المنتجات
      • دراسة رضا العملاء
      • اختبار تجربة العميل
    • المراقبة والتقييم
      • تطوير السياسات وأدلة الإجراءات
      • التقييم النهائي
      • تقييم الاحتياجات الإنسانية
      • تحليل الأثر
      • تقييم السوق
      • المراقبة كطرف ثالث (TPM)
      • التحقق من قوائم المستفيدين
    • الأبحاث السياسية والاجتماعية
      • تطوير المؤشرات
      • تطوير المقاييس
      • استطلاعات الرأي
      • الشراكات البحثية
      • الاختبارات الإحصائية للأبحاث
    • تدريبات
    • الأجندة
      • دراسات بحثية
      • الأدلة
      • التقارير التفاعلية
      • الأخبار
      • الاسئلة المتكررة
    • حول اندكيتورز
    Start typing to see posts you are looking for.