يعد حجم الدفعة والعصر وحجم مجموعة البيانات من الجوانب الحاسمة في التعلم الآلي ويشار إليها عادةً باسم المعلمات الفائقة. لفهم هذا المفهوم، دعونا نتعمق في كل مصطلح على حدة.
حجم الدفعة:
حجم الدُفعة عبارة عن معلمة تشعبية تحدد عدد العينات التي تمت معالجتها قبل تحديث أوزان النموذج أثناء التدريب. ويلعب دورًا مهمًا في تحديد سرعة واستقرار عملية التعلم. يسمح حجم الدفعة الأصغر بإجراء المزيد من التحديثات على أوزان النموذج، مما يؤدي إلى تقارب أسرع. ومع ذلك، يمكن أن يؤدي ذلك أيضًا إلى إدخال الضوضاء في عملية التعلم. من ناحية أخرى، يوفر حجم الدفعة الأكبر تقديرًا أكثر استقرارًا للتدرج ولكنه قد يؤدي إلى إبطاء عملية التدريب.
على سبيل المثال، في النسب التدرج العشوائي (SGD)، يُعرف حجم الدفعة 1 باسم SGD النقي، حيث يقوم النموذج بتحديث أوزانه بعد معالجة كل عينة فردية. على العكس من ذلك، يُعرف حجم الدُفعة الذي يساوي حجم مجموعة بيانات التدريب باسم نزول التدرج الدفعي، حيث يقوم النموذج بتحديث أوزانه مرة واحدة في كل فترة.
عهد:
العصر هو معلمة تشعبية أخرى تحدد عدد المرات التي يتم فيها تمرير مجموعة البيانات بأكملها للأمام والخلف عبر الشبكة العصبية أثناء التدريب. يسمح تدريب النموذج لعصور متعددة بتعلم الأنماط المعقدة في البيانات عن طريق ضبط أوزانها بشكل متكرر. ومع ذلك، يمكن أن يؤدي التدريب على عدد كبير جدًا من العصور إلى الإفراط في التجهيز، حيث يؤدي النموذج أداءً جيدًا على بيانات التدريب ولكنه يفشل في التعميم على البيانات غير المرئية.
على سبيل المثال، إذا كانت مجموعة البيانات تتكون من 1,000 عينة وتم تدريب النموذج لمدة 10 فترات، فهذا يعني أن النموذج قد شاهد مجموعة البيانات بأكملها 10 مرات أثناء عملية التدريب.
حجم مجموعة البيانات:
يشير حجم مجموعة البيانات إلى عدد العينات المتاحة لتدريب نموذج التعلم الآلي. وهو عامل حاسم يؤثر بشكل مباشر على أداء النموذج وقدرته على التعميم. غالبًا ما يؤدي حجم مجموعة البيانات الأكبر إلى أداء أفضل للنموذج لأنه يوفر أمثلة أكثر تنوعًا للنموذج للتعلم منها. ومع ذلك، فإن العمل مع مجموعات البيانات الكبيرة يمكن أن يؤدي أيضًا إلى زيادة الموارد الحسابية والوقت اللازم للتدريب.
من الناحية العملية، من الضروري تحقيق التوازن بين حجم مجموعة البيانات وتعقيد النموذج لمنع الإفراط في التجهيز أو النقص في التجهيز. يمكن استخدام تقنيات مثل زيادة البيانات وتنظيمها لتحقيق أقصى استفادة من مجموعات البيانات المحدودة.
يعد حجم الدفعة والعصر وحجم مجموعة البيانات كلها معلمات فائقة في التعلم الآلي تؤثر بشكل كبير على عملية التدريب والأداء النهائي للنموذج. يعد فهم كيفية ضبط هذه المعلمات الفائقة بشكل فعال أمرًا بالغ الأهمية لبناء نماذج قوية ودقيقة للتعلم الآلي.
أسئلة وأجوبة أخرى حديثة بخصوص EITC/AI/GCML تعلم الآلة على Google Cloud:
- ما هو تحويل النص إلى كلام (TTS) وكيف يعمل مع الذكاء الاصطناعي؟
- ما هي القيود المفروضة على العمل مع مجموعات البيانات الكبيرة في التعلم الآلي؟
- هل يمكن للتعلم الآلي تقديم بعض المساعدة الحوارية؟
- ما هو ملعب TensorFlow؟
- ماذا تعني مجموعة البيانات الأكبر في الواقع؟
- ما هي بعض الأمثلة على المعلمات الفائقة للخوارزمية؟
- ما هو التعلم المجمع؟
- ماذا لو لم تكن خوارزمية التعلم الآلي المختارة مناسبة وكيف يمكن التأكد من اختيار الخوارزمية الصحيحة؟
- هل يحتاج نموذج التعلم الآلي إلى الإشراف أثناء التدريب؟
- ما هي المعلمات الأساسية المستخدمة في الخوارزميات القائمة على الشبكة العصبية؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/GCML Google Cloud Machine Learning