لتحقيق دقة أعلى في نموذج التعلم الآلي الخاص بنا ، هناك العديد من المعلمات الفائقة التي يمكننا تجربتها. تعد المعلمات التشعبية معلمات قابلة للتعديل يتم تعيينها قبل بدء عملية التعلم. يتحكمون في سلوك خوارزمية التعلم ولهم تأثير كبير على أداء النموذج.
أحد العوامل المهمة التي يجب مراعاتها هو معدل التعلم. يحدد معدل التعلم حجم الخطوة عند كل تكرار لخوارزمية التعلم. يسمح معدل التعلم الأعلى للنموذج بالتعلم بشكل أسرع ولكن قد يؤدي إلى تجاوز الحل الأمثل. من ناحية أخرى ، قد يؤدي انخفاض معدل التعلم إلى تقارب أبطأ ولكن يمكن أن يساعد النموذج في تجنب التجاوز. من الأهمية بمكان العثور على معدل التعلم الأمثل الذي يوازن المفاضلة بين سرعة التقارب والدقة.
معلمة تشعبية أخرى للتجربة هي حجم الدُفعة. يحدد حجم الدُفعة عدد أمثلة التدريب التي تتم معالجتها في كل تكرار لخوارزمية التعلم. يمكن أن يوفر حجم الدُفعة الأصغر تقديرًا أكثر دقة للتدرج اللوني ولكن قد يؤدي إلى تقارب أبطأ. على العكس من ذلك ، يمكن أن يؤدي حجم الدُفعة الأكبر إلى تسريع عملية التعلم ولكنه قد يؤدي إلى حدوث ضوضاء في تقدير التدرج اللوني. يعتمد العثور على حجم الدُفعة الصحيح على حجم مجموعة البيانات والموارد الحسابية المتاحة.
عدد الوحدات المخفية في الشبكة العصبية هو معلمة تشعبية أخرى يمكن ضبطها. يمكن أن تؤدي زيادة عدد الوحدات المخفية إلى زيادة قدرة النموذج على تعلم الأنماط المعقدة ، ولكنها قد تؤدي أيضًا إلى زيادة التجهيز إذا لم يتم تنظيمها بشكل صحيح. على العكس من ذلك ، قد يؤدي تقليل عدد الوحدات المخفية إلى تبسيط النموذج ولكنه قد يؤدي إلى نقص في التركيب. من المهم تحقيق توازن بين تعقيد النموذج وقدرة التعميم.
التنظيم هو أسلوب آخر يمكن التحكم فيه من خلال المعلمات الفائقة. يساعد التنظيم على منع فرط التخصيص عن طريق إضافة مصطلح جزائي إلى وظيفة الخسارة. يتم التحكم في قوة التنظيم بواسطة معلمة فائقة تسمى معلمة التنظيم. سينتج عن معلمة التنظيم الأعلى نموذجًا أبسط مع احتواء أقل ولكن قد يؤدي أيضًا إلى عدم ملاءمة. على العكس من ذلك ، تسمح معلمة التنظيم الأقل للنموذج بتلائم بيانات التدريب بشكل وثيق ولكن قد يؤدي إلى زيادة التجهيز. يمكن استخدام التحقق المتقاطع للعثور على معامل التنظيم الأمثل.
يعد اختيار خوارزمية التحسين أيضًا معلمة تشعبية مهمة. نزول التدرج هو خوارزمية تحسين شائعة الاستخدام ، ولكن هناك اختلافات مثل نزول التدرج العشوائي (SGD) وآدم و RMSprop. تحتوي كل خوارزمية على معلماتها الفائقة الخاصة التي يمكن ضبطها ، مثل تحلل الزخم ومعدل التعلم. يمكن أن تساعد تجربة خوارزميات التحسين المختلفة ومعلماتها الفائقة في تحسين أداء النموذج.
بالإضافة إلى هذه المعلمات الفائقة ، تشمل العوامل الأخرى التي يمكن استكشافها بنية الشبكة ووظائف التنشيط المستخدمة وتهيئة معلمات النموذج. قد تكون البنى المختلفة ، مثل الشبكات العصبية التلافيفية (CNN) أو الشبكات العصبية المتكررة (RNN) ، أكثر ملاءمة لمهام محددة. يمكن أن يؤثر اختيار وظائف التنشيط المناسبة ، مثل ReLU أو السيني ، أيضًا على أداء النموذج. يمكن أن يساعد التهيئة الصحيحة لمعلمات النموذج في تقارب خوارزمية التعلم بشكل أسرع وتحقيق دقة أفضل.
يتطلب تحقيق دقة أعلى في نموذج التعلم الآلي الخاص بنا تجربة العديد من المعلمات الفائقة. يعد معدل التعلم وحجم الدُفعة وعدد الوحدات المخفية ومعلمة التنظيم وخوارزمية التحسين وبنية الشبكة ووظائف التنشيط وتهيئة المعلمة كلها معلمات تشعبية يمكن ضبطها لتحسين أداء النموذج. من المهم تحديد هذه المعلمات الفائقة وضبطها بعناية لتحقيق التوازن بين سرعة التقارب والدقة ، وكذلك لمنع فرط التجهيز أو عدم ملاءمة.
أسئلة وأجوبة أخرى حديثة بخصوص EITC/AI/GCML تعلم الآلة على Google Cloud:
- ما هو تحويل النص إلى كلام (TTS) وكيف يعمل مع الذكاء الاصطناعي؟
- ما هي القيود المفروضة على العمل مع مجموعات البيانات الكبيرة في التعلم الآلي؟
- هل يمكن للتعلم الآلي تقديم بعض المساعدة الحوارية؟
- ما هو ملعب TensorFlow؟
- ماذا تعني مجموعة البيانات الأكبر في الواقع؟
- ما هي بعض الأمثلة على المعلمات الفائقة للخوارزمية؟
- ما هو التعلم المجمع؟
- ماذا لو لم تكن خوارزمية التعلم الآلي المختارة مناسبة وكيف يمكن التأكد من اختيار الخوارزمية الصحيحة؟
- هل يحتاج نموذج التعلم الآلي إلى الإشراف أثناء التدريب؟
- ما هي المعلمات الأساسية المستخدمة في الخوارزميات القائمة على الشبكة العصبية؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/GCML Google Cloud Machine Learning