يعد تحديد ما إذا كان نموذج التعلم الآلي قد تم تدريبه بشكل صحيح جانبًا مهمًا في عملية تطوير النموذج. في حين أن الدقة هي مقياس مهم (أو حتى مقياس رئيسي) في تقييم أداء النموذج، إلا أنها ليست المؤشر الوحيد للنموذج المدرب جيدًا. إن تحقيق دقة أعلى من 90% ليس عتبة عالمية لجميع مهام التعلم الآلي. يمكن أن يختلف مستوى الدقة المقبول اعتمادًا على المشكلة المحددة التي تتم معالجتها.
الدقة هي مقياس لعدد المرات التي يقوم فيها النموذج بتنبؤات صحيحة من بين جميع التنبؤات التي تم إجراؤها. ويتم حسابها بقسمة عدد التنبؤات الصحيحة على إجمالي عدد التنبؤات. ومع ذلك، فإن الدقة وحدها قد لا توفر صورة كاملة لأداء النموذج، خاصة في الحالات التي تكون فيها مجموعة البيانات غير متوازنة، مما يعني وجود اختلاف كبير في عدد مثيلات كل فئة.
بالإضافة إلى الدقة، تُستخدم مقاييس التقييم الأخرى مثل الدقة والاستدعاء ودرجة F1 بشكل شائع لتقييم أداء نموذج التعلم الآلي. تقيس الدقة نسبة التنبؤات الإيجابية الحقيقية من بين جميع التنبؤات الإيجابية، بينما يحسب الاستدعاء نسبة التنبؤات الإيجابية الحقيقية من بين جميع التوقعات الإيجابية الفعلية. درجة F1 هي المتوسط التوافقي للدقة والتذكر وتوفر التوازن بين المقياسين.
من الضروري مراعاة المتطلبات المحددة للمشكلة المطروحة عند تحديد ما إذا كان النموذج قد تم تدريبه بشكل صحيح. على سبيل المثال، في مهمة التشخيص الطبي، يعد تحقيق الدقة العالية أمرًا بالغ الأهمية لضمان تنبؤات دقيقة وتجنب التشخيص الخاطئ. من ناحية أخرى، في سيناريو الكشف عن الاحتيال، قد يكون الاستدعاء المرتفع أكثر أهمية لالتقاط أكبر عدد ممكن من حالات الاحتيال، حتى على حساب بعض النتائج الإيجابية الكاذبة.
علاوة على ذلك، ينبغي تقييم أداء النموذج ليس فقط على بيانات التدريب ولكن أيضًا على مجموعة بيانات التحقق المنفصلة لتقييم قدرات التعميم الخاصة به. يمكن اكتشاف التجهيز الزائد، حيث يؤدي النموذج أداءً جيدًا على بيانات التدريب ولكن بشكل سيئ على البيانات غير المرئية، من خلال مقاييس التحقق من الصحة. يمكن أن تساعد تقنيات مثل التحقق المتبادل في تخفيف التجهيز الزائد وتوفير تقييم أكثر قوة لأداء النموذج.
في حين أن الدقة هي مؤشر رئيسي لأداء النموذج، فمن الضروري مراعاة مقاييس أخرى مثل الدقة والاستدعاء ودرجة F1، بالإضافة إلى المتطلبات المحددة لمجال المشكلة. لا توجد عتبة ثابتة للدقة تنطبق عالميًا، ويجب أن يكون تقييم النموذج شاملاً، مع الأخذ في الاعتبار المقاييس المختلفة وتقنيات التحقق لضمان فعاليته في تطبيقات العالم الحقيقي.
أسئلة وأجوبة أخرى حديثة بخصوص EITC/AI/GCML تعلم الآلة على Google Cloud:
- ما هو تحويل النص إلى كلام (TTS) وكيف يعمل مع الذكاء الاصطناعي؟
- ما هي القيود المفروضة على العمل مع مجموعات البيانات الكبيرة في التعلم الآلي؟
- هل يمكن للتعلم الآلي تقديم بعض المساعدة الحوارية؟
- ما هو ملعب TensorFlow؟
- ماذا تعني مجموعة البيانات الأكبر في الواقع؟
- ما هي بعض الأمثلة على المعلمات الفائقة للخوارزمية؟
- ما هو التعلم المجمع؟
- ماذا لو لم تكن خوارزمية التعلم الآلي المختارة مناسبة وكيف يمكن التأكد من اختيار الخوارزمية الصحيحة؟
- هل يحتاج نموذج التعلم الآلي إلى الإشراف أثناء التدريب؟
- ما هي المعلمات الأساسية المستخدمة في الخوارزميات القائمة على الشبكة العصبية؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/GCML Google Cloud Machine Learning