يعد التعلم الخاضع للإشراف وغير الخاضع للإشراف والتعليم المعزز ثلاثة أساليب متميزة في مجال التعلم الآلي. يستخدم كل نهج تقنيات وخوارزميات مختلفة لمعالجة أنواع مختلفة من المشاكل وتحقيق أهداف محددة. دعونا نستكشف الفروق بين هذه الأساليب ونقدم شرحًا شاملاً لخصائصها وتطبيقاتها.
التعلم الخاضع للإشراف هو نوع من التعلم الآلي حيث تتعلم الخوارزمية من البيانات المصنفة. تتكون البيانات المصنفة من أمثلة المدخلات المقترنة بالمخرجات الصحيحة المقابلة لها أو القيمة المستهدفة. الهدف من التعلم الخاضع للإشراف هو تدريب نموذج يمكنه التنبؤ بدقة بمخرجات المدخلات الجديدة غير المرئية. تستخدم خوارزمية التعلم البيانات المصنفة لاستنتاج الأنماط والعلاقات بين ميزات الإدخال وتسميات الإخراج. ثم يقوم بتعميم هذه المعرفة لإجراء تنبؤات بشأن البيانات الجديدة غير المسماة. يُستخدم التعلم الخاضع للإشراف بشكل شائع في مهام مثل التصنيف والانحدار.
على سبيل المثال، في مشكلة التصنيف، يتم تدريب الخوارزمية على مجموعة بيانات حيث يتم تصنيف كل نقطة بيانات بفئة معينة. تتعلم الخوارزمية تصنيف نقاط البيانات الجديدة غير المرئية في إحدى الفئات المحددة مسبقًا بناءً على الأنماط التي تعلمتها من الأمثلة المسماة. في مشكلة الانحدار، تتعلم الخوارزمية التنبؤ بقيمة عددية مستمرة بناءً على ميزات الإدخال.
ومن ناحية أخرى، يتعامل التعلم غير الخاضع للرقابة مع البيانات غير المسماة. الهدف من التعلم غير الخاضع للرقابة هو اكتشاف الأنماط أو الهياكل أو العلاقات المخفية داخل البيانات دون أي معرفة مسبقة بتسميات المخرجات. على عكس التعلم الخاضع للإشراف، لا تحتوي خوارزميات التعلم غير الخاضع للإشراف على قيم مستهدفة واضحة لتوجيه عملية التعلم. وبدلاً من ذلك، يركزون على إيجاد تمثيلات أو مجموعات ذات معنى في البيانات. يُستخدم التعلم غير الخاضع للرقابة بشكل شائع في مهام مثل التجميع وتقليل الأبعاد واكتشاف الحالات الشاذة.
التجميع هو تطبيق شائع للتعلم غير الخاضع للرقابة، حيث تقوم الخوارزمية بتجميع نقاط البيانات المتشابهة معًا بناءً على خصائصها الجوهرية. على سبيل المثال، في تجزئة العملاء، يمكن استخدام خوارزمية التعلم غير الخاضعة للرقابة لتحديد مجموعات متميزة من العملاء بناءً على سلوكهم الشرائي أو معلوماتهم الديموغرافية.
يعد التعلم المعزز نموذجًا مختلفًا حيث يتعلم الوكيل التفاعل مع البيئة لتعظيم إشارة المكافأة التراكمية. في التعلم المعزز، تتعلم الخوارزمية من خلال عملية التجربة والخطأ من خلال اتخاذ الإجراءات ومراقبة حالة البيئة وتلقي ردود الفعل في شكل مكافآت أو عقوبات. الهدف هو إيجاد سياسة مثالية أو مجموعة من الإجراءات التي تزيد من المكافأة على المدى الطويل. يُستخدم التعلم المعزز بشكل شائع في مهام مثل ممارسة الألعاب والروبوتات والأنظمة المستقلة.
على سبيل المثال، في لعبة الشطرنج، يمكن لوكيل التعلم المعزز أن يتعلم اللعب من خلال استكشاف الحركات المختلفة، وتلقي المكافآت أو العقوبات بناءً على نتيجة كل حركة، وتعديل إستراتيجيته لتعظيم فرص الفوز.
يستخدم التعلم الخاضع للإشراف البيانات المصنفة لتدريب نموذج على مهام التنبؤ، ويكتشف التعلم غير الخاضع للإشراف الأنماط والهياكل في البيانات غير المسماة، ويتعلم التعلم المعزز من خلال التفاعل مع البيئة لتعظيم إشارة المكافأة. كل نهج له نقاط القوة والضعف الخاصة به، وهو مناسب لأنواع مختلفة من المشاكل والتطبيقات.
أسئلة وأجوبة أخرى حديثة بخصوص EITC/AI/GCML تعلم الآلة على Google Cloud:
- ما هو تحويل النص إلى كلام (TTS) وكيف يعمل مع الذكاء الاصطناعي؟
- ما هي القيود المفروضة على العمل مع مجموعات البيانات الكبيرة في التعلم الآلي؟
- هل يمكن للتعلم الآلي تقديم بعض المساعدة الحوارية؟
- ما هو ملعب TensorFlow؟
- ماذا تعني مجموعة البيانات الأكبر في الواقع؟
- ما هي بعض الأمثلة على المعلمات الفائقة للخوارزمية؟
- ما هو التعلم المجمع؟
- ماذا لو لم تكن خوارزمية التعلم الآلي المختارة مناسبة وكيف يمكن التأكد من اختيار الخوارزمية الصحيحة؟
- هل يحتاج نموذج التعلم الآلي إلى الإشراف أثناء التدريب؟
- ما هي المعلمات الأساسية المستخدمة في الخوارزميات القائمة على الشبكة العصبية؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/GCML Google Cloud Machine Learning