يعد استخراج الميزات خطوة حاسمة في عملية الشبكة العصبية التلافيفية (CNN) المطبقة على مهام التعرف على الصور. في شبكات CNN، تتضمن عملية استخراج الميزات استخراج ميزات ذات معنى من الصور المدخلة لتسهيل التصنيف الدقيق. تعد هذه العملية ضرورية لأن قيم البكسل الأولية من الصور ليست مناسبة بشكل مباشر لمهام التصنيف. ومن خلال استخلاص الميزات ذات الصلة، يمكن لشبكات CNN أن تتعلم كيفية التعرف على الأنماط والأشكال داخل الصور، مما يمكنها من التمييز بين فئات مختلفة من الكائنات أو الكيانات.
تتضمن عملية استخراج الميزات في شبكات CNN عادةً استخدام الطبقات التلافيفية. تقوم هذه الطبقات بتطبيق المرشحات، المعروفة أيضًا باسم النواة، على الصورة المدخلة. يقوم كل مرشح بمسح الصورة المدخلة، وإجراء عمليات الضرب والجمع حسب العناصر لإنتاج خريطة الميزات. تلتقط خرائط المعالم أنماطًا أو ميزات محددة موجودة في الصورة المدخلة، مثل الحواف أو الأنسجة أو الأشكال. يسمح استخدام المرشحات المتعددة في الطبقات التلافيفية لشبكات CNN باستخراج مجموعة متنوعة من الميزات في تسلسلات هرمية مكانية مختلفة.
بعد الطبقات التلافيفية، غالبًا ما تتضمن شبكات CNN وظائف التنشيط مثل ReLU (الوحدة الخطية المعدلة) لإدخال اللاخطية في النموذج. تعد وظائف التنشيط غير الخطية ضرورية لتمكين شبكات CNN من تعلم العلاقات والأنماط المعقدة داخل البيانات. يتم بعد ذلك تطبيق طبقات التجميع، مثل التجميع الأقصى أو التجميع المتوسط، لتقليل الأبعاد المكانية لخرائط المعالم مع الاحتفاظ بالمعلومات الأكثر صلة. يساعد التجميع في جعل الشبكة أكثر قوة في التعامل مع الاختلافات في الصور المدخلة ويقلل من التعقيد الحسابي.
بعد الطبقات التلافيفية والتجميعية، يتم تسوية المعالم المستخرجة إلى متجه وتمريرها عبر طبقة واحدة أو أكثر متصلة بالكامل. تعمل هذه الطبقات كمصنفات، حيث تتعلم كيفية تعيين الميزات المستخرجة إلى فئات الإخراج المقابلة. عادةً ما تستخدم الطبقة النهائية المتصلة بالكامل وظيفة تنشيط softmax لإنشاء احتمالات الفئة لمهام التصنيف متعددة الفئات.
لتوضيح عملية استخراج الميزة في CNN للتعرف على الصور، فكر في مثال تصنيف صور الملابس. في هذا السيناريو، ستتعلم شبكة CNN استخراج ميزات مثل القوام والألوان والأنماط الفريدة لأنواع مختلفة من عناصر الملابس، مثل الأحذية أو القمصان أو السراويل. من خلال معالجة مجموعة كبيرة من صور الملابس المُصنفة، ستقوم CNN بتعديل مرشحاتها وأوزانها بشكل متكرر لتحديد وتصنيف هذه السمات المميزة بدقة، مما يمكنها في النهاية من عمل تنبؤات على الصور غير المرئية بدقة عالية.
يعد استخراج الميزات مكونًا أساسيًا في شبكات CNN للتعرف على الصور، مما يمكّن النموذج من التعلم والتمييز بين الأنماط والميزات ذات الصلة داخل الصور المدخلة. من خلال استخدام الطبقات التلافيفية ووظائف التنشيط وطبقات التجميع والطبقات المتصلة بالكامل، يمكن لشبكات CNN استخراج الميزات المفيدة والاستفادة منها بشكل فعال لأداء مهام تصنيف دقيقة.
أسئلة وأجوبة أخرى حديثة بخصوص أساسيات EITC/AI/TFF TensorFlow:
- كيف يمكن للمرء استخدام طبقة التضمين لتعيين المحاور المناسبة تلقائيًا لمؤامرة تمثيل الكلمات كمتجهات؟
- ما هو الغرض من الحد الأقصى للتجميع في CNN؟
- هل من الضروري استخدام وظيفة التعلم غير المتزامنة لنماذج التعلم الآلي التي تعمل في TensorFlow.js؟
- ما هو الحد الأقصى لعدد الكلمات المعلمة لواجهة برمجة تطبيقات TensorFlow Keras Tokenizer؟
- هل يمكن استخدام TensorFlow Keras Tokenizer API للعثور على الكلمات الأكثر شيوعًا؟
- ما هو توكو؟
- ما هي العلاقة بين عدد من العصور في نموذج التعلم الآلي ودقة التنبؤ من تشغيل النموذج؟
- هل تنتج الحزمة المجاورة لواجهة برمجة التطبيقات (API) في التعلم المنظم العصبي لـ TensorFlow مجموعة بيانات تدريب معززة تعتمد على بيانات الرسم البياني الطبيعي؟
- ما هي حزمة الجيران API في التعلم المنظم العصبي لـ TensorFlow؟
- هل يمكن استخدام التعلم المنظم العصبي مع البيانات التي لا يوجد لها رسم بياني طبيعي؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/TFF TensorFlow Fundamentals