ما الذي تقوم به هذه الحاسبة
تقيّم هذه الأداة أداء نموذج التصنيف الثنائي عبر حساب ثلاثة مقاييس أساسية: الدقة (Precision)، والاستدعاء (Recall)، ومقياس F1. كل ما عليك هو إدخال الأعداد الخام من مصفوفة الالتباس (Confusion Matrix) الخاصة بك — وهي: القيم الموجبة الصحيحة (TP)، والقيم الموجبة الخاطئة (FP)، والقيم السالبة الخاطئة (FN) — لتحصل على كل مقياس بصيغة نسبة مئوية. هذه المقاييس مستخدمة على نطاق واسع في تعلّم الآلة، واسترجاع المعلومات، والفحوصات الطبية، وكل مجال يقوم على تصنيف العناصر إلى فئتين: إيجابية وسلبية.
طريقة الاستخدام
أدخل عدد القيم الموجبة الصحيحة (الحالات الإيجابية التي تنبأ بها النموذج بشكل صحيح)، والقيم الموجبة الخاطئة (الحالات السلبية التي صنّفها النموذج خطأً على أنها إيجابية)، والقيم السالبة الخاطئة (الحالات الإيجابية التي أغفلها النموذج). ثم اضغط على زر الحساب لتظهر لك قيم الدقة والاستدعاء وF1. لاحظ أن القيم السالبة الصحيحة (True Negatives) غير مطلوبة لحساب هذه المقاييس تحديدًا.
شرح المعادلات
\( \text{Precision} = \text{TP} / (\text{TP} + \text{FP}) \) تجيب عن السؤال: «من بين كل ما صنّفته على أنه إيجابي، كم نسبة الصحيح فعلاً؟». ارتفاع الدقة يعني قلة الإنذارات الكاذبة.
\( \text{Recall} = \text{TP} / (\text{TP} + \text{FN}) \) يجيب عن السؤال: «من بين كل ما كان إيجابيًا في الواقع، كم نسبة ما تمكّنت من اكتشافه؟». ارتفاع الاستدعاء يعني قلة الحالات الفائتة.
أما مقياس F1 فهو المتوسط التوافقي (Harmonic Mean) بين الدقة والاستدعاء: $$\text{F1} = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}$$ وهو يوازن بين المقياسين معًا، ويكون مفيدًا بشكل خاص عندما تكون الفئات غير متوازنة.
مثال تطبيقي
لنفترض أن مرشّح بريد عشوائي (Spam) صنّف 100 رسالة على أنها مزعجة. من بينها 80 رسالة مزعجة فعلاً (TP) و20 رسالة ليست كذلك (FP). كما أغفل المرشّح 10 رسائل مزعجة حقيقية (FN). فتكون الدقة \( = 80 / (80 + 20) = 0.80 = 80\% \). والاستدعاء \( = 80 / (80 + 10) = 0.889 = 88.89\% \). ومقياس F1 \( = 2 \cdot (0.80 \cdot 0.889) / (0.80 + 0.889) = 84.21\% \).
الأسئلة الشائعة
متى أفضّل الدقة على الاستدعاء؟ فضّل الدقة عندما تكون كلفة القيم الموجبة الخاطئة عالية (مثل تصنيف رسالة مشروعة على أنها بريد مزعج). أما عندما تكون كلفة إغفال الحالات الإيجابية عالية (مثل الكشف المبكر عن السرطان) فالأولوية للاستدعاء.
لماذا نستخدم مقياس F1؟ قد تكون الدقة الإجمالية (Accuracy) مضلِّلة عند التعامل مع بيانات غير متوازنة. ومقياس F1 يدمج الدقة والاستدعاء في رقم واحد متوازن.
ماذا لو كان المقام يساوي صفرًا؟ إذا كان TP+FP أو TP+FN يساوي صفرًا، فإن المقياس يصبح غير معرّف؛ وفي هذه الحالة تُظهر الحاسبة القيمة 0%.