تم تصميم الشبكات العصبية التلافيفية (CNN) لأول مرة لغرض التعرف على الصور في مجال رؤية الكمبيوتر. هذه الشبكات هي نوع متخصص من الشبكات العصبية الاصطناعية التي أثبتت فعاليتها العالية في تحليل البيانات المرئية. كان تطوير شبكات CNN مدفوعًا بالحاجة إلى إنشاء نماذج يمكنها تصنيف الصور وتصنيفها بدقة، وقد أدى نجاحها في هذا المجال إلى استخدامها على نطاق واسع في تطبيقات أخرى مختلفة مثل اكتشاف الكائنات وتجزئة الصور وحتى معالجة اللغة الطبيعية.
إن شبكات CNN مستوحاة من بنية ووظيفة القشرة البصرية في الدماغ البشري. مثل القشرة البصرية، تتكون شبكات CNN من طبقات متعددة من الخلايا العصبية المترابطة التي تعالج جوانب مختلفة من بيانات الإدخال. يكمن الابتكار الرئيسي لشبكات CNN في قدرتها على التعلم تلقائيًا واستخراج الميزات ذات الصلة من الصور، مما يلغي الحاجة إلى هندسة الميزات اليدوية. يتم تحقيق ذلك من خلال استخدام الطبقات التلافيفية، التي تطبق المرشحات على الصورة المدخلة لاكتشاف الأنماط والميزات المرئية المختلفة، مثل الحواف والزوايا والأنسجة.
جاء الاختراق الأول في شبكات CNN مع تقديم بنية LeNet-5 بواسطة Yann LeCun et al. في عام 1998. تم تصميم LeNet-5 خصيصًا للتعرف على الأرقام المكتوبة بخط اليد وحقق أداءً رائعًا في مجموعة بيانات MNIST، وهي مجموعة بيانات قياسية تستخدم على نطاق واسع لتقييم خوارزميات التعرف على الصور. أظهر LeNet-5 قوة شبكات CNN في التقاط الميزات الهرمية من الصور، مما يتيح تصنيفًا دقيقًا حتى في ظل وجود اختلافات في الحجم والتدوير والترجمة.
منذ ذلك الحين، تطورت شبكات CNN بشكل ملحوظ، مع تطوير بنيات أعمق وأكثر تعقيدًا. كان أحد التطورات الملحوظة هو تقديم بنية AlexNet بواسطة Alex Krizhevsky et al. في عام 2012. حققت AlexNet طفرة في تصنيف الصور من خلال الفوز في تحدي ImageNet للتعرف البصري واسع النطاق (ILSVRC) بمعدل خطأ أقل بكثير مقارنة بالطرق السابقة. مهد هذا النجاح الطريق لاعتماد شبكات CNN على نطاق واسع في مهام التعرف على الصور.
تم أيضًا تطبيق CNNs بنجاح على مهام رؤية الكمبيوتر الأخرى. على سبيل المثال، في الكشف عن الكائنات، يمكن دمج CNNs مع طبقات إضافية لتوطين الكائنات وتصنيفها داخل الصورة. الشبكة العصبية التلافيفية الشهيرة القائمة على المنطقة (R-CNN) والتي قدمها روس جيرشيك وآخرون. في عام 2014 مثال على مثل هذه الهندسة المعمارية. حققت R-CNN أحدث النتائج فيما يتعلق بمعايير الكشف عن الكائنات من خلال الاستفادة من قوة شبكات CNN لاستخراج الميزات ودمجها مع أساليب اقتراح المنطقة.
تم تصميم الشبكات العصبية التلافيفية لأول مرة لمهام التعرف على الصور في مجال رؤية الكمبيوتر. لقد أحدثوا ثورة في هذا المجال من خلال تعلم الميزات ذات الصلة تلقائيًا من الصور، مما يلغي الحاجة إلى هندسة الميزات اليدوية. أدى تطوير شبكات CNN إلى تطورات كبيرة في تصنيف الصور، واكتشاف الأشياء، والعديد من مهام الرؤية الحاسوبية الأخرى.
أسئلة وأجوبة أخرى حديثة بخصوص التعلم العميق المتقدم EITC/AI/ADL:
- لماذا نحتاج إلى تطبيق التحسينات في التعلم الآلي؟
- متى يحدث التجهيز الزائد؟
- هل يمكن للشبكات العصبية التلافيفية معالجة البيانات المتسلسلة من خلال دمج التلافيف بمرور الوقت ، كما هو مستخدم في نماذج التسلسل التلافيفي للتسلسل؟
- هل تعتمد شبكات الخصومة التوليدية (GANs) على فكرة المولد والمميز؟