يعد تخصيص 80% من الوزن للتدريب و20% من الوزن للتقييم في سياق التعلم الآلي قرارًا استراتيجيًا يعتمد على عدة عوامل. يهدف هذا التوزيع إلى تحقيق التوازن بين تحسين عملية التعلم وضمان التقييم الدقيق لأداء النموذج. في هذا الرد، سوف نتعمق في الأسباب الكامنة وراء هذا الاختيار ونستكشف القيمة التعليمية التي يقدمها.
لفهم الأساس المنطقي وراء تقسيم التدريب بنسبة 80% والتقييم بنسبة 20%، من الضروري فهم الخطوات السبع للتعلم الآلي. تشكل هذه الخطوات، التي تشمل جمع البيانات، وإعداد البيانات، والتدريب النموذجي، وتقييم النموذج، وضبط النموذج، ونشر النموذج، ومراقبة النموذج، إطارًا شاملاً لبناء نماذج التعلم الآلي.
تتضمن الخطوة الأولية، جمع البيانات، جمع البيانات ذات الصلة لتدريب النموذج. تتم بعد ذلك معالجة هذه البيانات وإعدادها في مرحلة إعداد البيانات. بمجرد أن تصبح البيانات جاهزة، تبدأ مرحلة تدريب النموذج، حيث يتم تعريض النموذج لمجموعة بيانات التدريب لمعرفة الأنماط والعلاقات. يتم بعد ذلك تقييم أداء النموذج باستخدام مجموعة بيانات منفصلة في مرحلة تقييم النموذج.
ينبع قرار تخصيص 80% من الوزن للتدريب و20% من الوزن للتقييم من حقيقة أن التدريب هو المرحلة الأولية التي يتعلم فيها النموذج من البيانات. أثناء التدريب، يقوم النموذج بضبط معلماته الداخلية لتقليل الفرق بين مخرجاته المتوقعة والمخرجات الفعلية في مجموعة بيانات التدريب. تتضمن هذه العملية تحديث معلمات النموذج بشكل متكرر باستخدام خوارزميات التحسين مثل نزول التدرج.
ومن خلال تعيين وزن أعلى للتدريب، فإننا نعطي الأولوية لقدرة النموذج على التعلم من البيانات والتقاط الأنماط المعقدة. مرحلة التدريب هي حيث يكتسب النموذج معرفته ويعمم من مجموعة بيانات التدريب للتنبؤ بالبيانات غير المرئية. كلما تعرض النموذج لمزيد من بيانات التدريب، كلما كان بإمكانه التعلم والتعميم بشكل أفضل. ولذلك، فإن تخصيص جزء كبير من عملية التقييم للتدريب يضمن أن النموذج لديه ما يكفي من التعرض لبيانات التدريب من أجل التعلم الفعال.
ومن ناحية أخرى، تلعب مرحلة التقييم دورًا حاسمًا في تقييم أداء النموذج على البيانات غير المرئية. تعمل مجموعة بيانات التقييم، المنفصلة عن مجموعة بيانات التدريب، بمثابة وكيل لسيناريوهات العالم الحقيقي. فهو يسمح لنا بقياس مدى قدرة النموذج على تعميم تعلمه على الحالات الجديدة وغير المرئية. يعد تقييم أداء النموذج أمرًا ضروريًا لقياس دقته أو إحكامه أو استرجاعه أو أي مقاييس أخرى ذات صلة، اعتمادًا على مجال المشكلة المحدد.
ويضمن الترجيح بنسبة 20% الممنوح للتقييم اختبار النموذج بدقة على البيانات غير المرئية وتوفير تقييم واقعي لقدراته. تساعد مرحلة التقييم هذه في الكشف عن أي مشكلات محتملة مثل التجهيز الزائد أو التجهيز غير المناسب أو التحيز في تنبؤات النموذج. كما أنه يتيح الضبط الدقيق للمعلمات الفائقة وبنية النموذج لتحسين الأداء.
لتوضيح هذا المفهوم، دعونا نفكر في مثال عملي. لنفترض أننا نقوم بتدريب نموذج للتعلم الآلي لتصنيف صور القطط والكلاب. خلال مرحلة التدريب، يتعلم النموذج التمييز بين سمات القطط والكلاب من خلال تحليل مجموعة كبيرة من الصور ذات العلامات. كلما زاد عدد الصور التي يمكن للنموذج التدرب عليها، أصبح أفضل في التمييز بين الفئتين.
بمجرد اكتمال التدريب، يتم تقييم النموذج باستخدام مجموعة بيانات منفصلة تحتوي على صور لم يسبق لها مثيل من قبل. تختبر مرحلة التقييم هذه قدرة النموذج على تعميم تعلمه وتصنيف الصور الجديدة غير المرئية بدقة. ومن خلال تخصيص 20% من الوزن للتقييم، فإننا نضمن أن يتم تقييم أداء النموذج بشكل شامل بناءً على البيانات غير المرئية، مما يوفر مقياسًا موثوقًا لفعاليته.
يعد توزيع 80% من الوزن للتدريب و20% من الوزن للتقييم في التعلم الآلي خيارًا استراتيجيًا يهدف إلى تحسين عملية التعلم مع ضمان التقييم الدقيق لأداء النموذج. ومن خلال تخصيص جزء كبير من عملية التقييم للتدريب، فإننا نعطي الأولوية لقدرة النموذج على التعلم من البيانات والتقاط الأنماط المعقدة. وفي الوقت نفسه، تقوم مرحلة التقييم باختبار النموذج بدقة على البيانات غير المرئية، مما يوفر تقييمًا واقعيًا لقدراته.
أسئلة وأجوبة أخرى حديثة بخصوص EITC/AI/GCML تعلم الآلة على Google Cloud:
- ما هو تحويل النص إلى كلام (TTS) وكيف يعمل مع الذكاء الاصطناعي؟
- ما هي القيود المفروضة على العمل مع مجموعات البيانات الكبيرة في التعلم الآلي؟
- هل يمكن للتعلم الآلي تقديم بعض المساعدة الحوارية؟
- ما هو ملعب TensorFlow؟
- ماذا تعني مجموعة البيانات الأكبر في الواقع؟
- ما هي بعض الأمثلة على المعلمات الفائقة للخوارزمية؟
- ما هو التعلم المجمع؟
- ماذا لو لم تكن خوارزمية التعلم الآلي المختارة مناسبة وكيف يمكن التأكد من اختيار الخوارزمية الصحيحة؟
- هل يحتاج نموذج التعلم الآلي إلى الإشراف أثناء التدريب؟
- ما هي المعلمات الأساسية المستخدمة في الخوارزميات القائمة على الشبكة العصبية؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/GCML Google Cloud Machine Learning