تشير البيانات المصنفة، في سياق الذكاء الاصطناعي (AI) وتحديدًا في مجال Google Cloud Machine Learning، إلى مجموعة بيانات تم تعليقها أو تمييزها بتسميات أو فئات محددة. تعمل هذه التسميات بمثابة الحقيقة الأساسية أو المرجع لتدريب خوارزميات التعلم الآلي. من خلال ربط نقاط البيانات بالتسميات المقابلة لها، يمكن لنموذج التعلم الآلي أن يتعلم التعرف على الأنماط وإجراء التنبؤات بناءً على بيانات جديدة غير مرئية.
تلعب البيانات المصنفة دورًا حاسمًا في التعلم الخاضع للإشراف، وهو نهج شائع في التعلم الآلي. في التعلم الخاضع للإشراف، يتم تدريب النموذج على مجموعة بيانات مصنفة لمعرفة العلاقة بين ميزات الإدخال وتسميات المخرجات المقابلة لها. تسمح عملية التدريب هذه للنموذج بتعميم معرفته وإجراء تنبؤات دقيقة بشأن البيانات الجديدة غير المرئية.
لتوضيح هذا المفهوم، دعونا نفكر في مثال لمهمة التعلم الآلي في مجال التعرف على الصور. لنفترض أننا نريد بناء نموذج يمكنه تصنيف صور الحيوانات إلى فئات مختلفة مثل القطط والكلاب والطيور. سنحتاج إلى مجموعة بيانات مصنفة حيث ترتبط كل صورة بتسميتها الصحيحة. على سبيل المثال، سيتم تصنيف صورة قطة على أنها "قطة"، وصورة كلب على أنها "كلب"، وما إلى ذلك.
ستتألف مجموعة البيانات المسماة من مجموعة من الصور والتسميات المقابلة لها. سيتم تمثيل كل صورة من خلال مجموعة من الميزات، مثل قيم البكسل أو التمثيلات ذات المستوى الأعلى المستخرجة من الصورة. تشير التسميات إلى الفئة أو الفئة الصحيحة التي تنتمي إليها كل صورة.
خلال مرحلة التدريب، سيتم تقديم نموذج التعلم الآلي مع مجموعة البيانات المسماة. سوف يتعلم كيفية تحديد الأنماط والعلاقات بين ميزات الإدخال والتسميات المقابلة. سيقوم النموذج بتحديث معلماته الداخلية لتقليل الفرق بين تنبؤاته والتسميات الحقيقية في بيانات التدريب.
بمجرد تدريب النموذج، يمكن استخدامه للتنبؤ بالصور الجديدة غير المرئية. بالنظر إلى صورة غير مُسماة، سيقوم النموذج بتحليل ميزاتها والتنبؤ بالعلامة الأكثر احتمالية بناءً على المعرفة المكتسبة من مجموعة البيانات المُصنفة. على سبيل المثال، إذا توقع النموذج أن الصورة تحتوي على قطة، فهذا يعني أنه قد تعرف على أنماط في الصورة تشير إلى قطة.
تعد البيانات المصنفة مكونًا أساسيًا في تدريب نماذج التعلم الآلي. فهو يوفر المعلومات اللازمة للنموذج للتعلم منها وإجراء تنبؤات دقيقة. ومن خلال ربط نقاط البيانات بالتسميات المقابلة لها، يمكن للنموذج أن يتعلم التعرف على الأنماط وتعميم معرفته على البيانات غير المرئية.
أسئلة وأجوبة أخرى حديثة بخصوص EITC/AI/GCML تعلم الآلة على Google Cloud:
- ما هو تحويل النص إلى كلام (TTS) وكيف يعمل مع الذكاء الاصطناعي؟
- ما هي القيود المفروضة على العمل مع مجموعات البيانات الكبيرة في التعلم الآلي؟
- هل يمكن للتعلم الآلي تقديم بعض المساعدة الحوارية؟
- ما هو ملعب TensorFlow؟
- ماذا تعني مجموعة البيانات الأكبر في الواقع؟
- ما هي بعض الأمثلة على المعلمات الفائقة للخوارزمية؟
- ما هو التعلم المجمع؟
- ماذا لو لم تكن خوارزمية التعلم الآلي المختارة مناسبة وكيف يمكن التأكد من اختيار الخوارزمية الصحيحة؟
- هل يحتاج نموذج التعلم الآلي إلى الإشراف أثناء التدريب؟
- ما هي المعلمات الأساسية المستخدمة في الخوارزميات القائمة على الشبكة العصبية؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/GCML Google Cloud Machine Learning