بنية الشبكة العصبية المستخدمة في المثال عبارة عن شبكة عصبية تلقائية ذات ثلاث طبقات: طبقة إدخال وطبقة مخفية وطبقة إخراج. تتكون طبقة الإدخال من 784 وحدة ، وهو ما يتوافق مع عدد وحدات البكسل في الصورة المدخلة. تمثل كل وحدة في طبقة الإدخال قيمة كثافة البكسل في الصورة.
تتكون الطبقة المخفية من 128 وحدة متصلة بالكامل بطبقة الإدخال. تحسب كل وحدة في الطبقة المخفية مجموعًا مرجحًا للمدخلات من طبقة الإدخال وتطبق وظيفة تنشيط لإنتاج مخرجات. في هذا المثال ، وظيفة التنشيط المستخدمة في الطبقة المخفية هي وظيفة الوحدة الخطية المصححة (ReLU). يتم تعريف وظيفة ReLU على أنها f (x) = max (0 ، x) ، حيث x هو المجموع المرجح لمدخلات الوحدة. تقدم وظيفة ReLU اللاخطية للشبكة ، مما يسمح لها بتعلم الأنماط والعلاقات المعقدة في البيانات.
تتكون طبقة المخرجات من 10 وحدات ، كل منها يمثل إحدى الفئات المحتملة في مشكلة التصنيف. ترتبط الوحدات الموجودة في طبقة الإخراج بشكل كامل بالوحدات الموجودة في الطبقة المخفية. على غرار الطبقة المخفية ، تحسب كل وحدة في طبقة المخرجات مجموعًا مرجحًا للمدخلات من الطبقة المخفية وتطبق وظيفة التنشيط. في هذا المثال ، وظيفة التنشيط المستخدمة في طبقة الإخراج هي وظيفة softmax. تقوم وظيفة softmax بتحويل المجموع المرجح للمدخلات إلى توزيع احتمالي على الفئات ، حيث يكون مجموع الاحتمالات مساويًا لـ 1. تمثل الوحدة ذات أعلى احتمالية الفئة المتوقعة لصورة الإدخال.
للتلخيص ، تتكون بنية الشبكة العصبية المستخدمة في المثال من طبقة إدخال تحتوي على 784 وحدة ، وطبقة مخفية بها 128 وحدة باستخدام وظيفة تنشيط ReLU ، وطبقة إخراج بها 10 وحدات باستخدام وظيفة تنشيط softmax.
أسئلة وأجوبة أخرى حديثة بخصوص بناء شبكة عصبية لأداء التصنيف:
- هل من الضروري استخدام وظيفة التعلم غير المتزامنة لنماذج التعلم الآلي التي تعمل في TensorFlow.js؟
- كيف يتم تجميع النموذج وتدريبه في TensorFlow.js ، وما هو دور دالة خسارة الانتروبيا الفئوية؟
- ما أهمية معدل التعلم وعدد الحقب في عملية التعلم الآلي؟
- كيف يتم تقسيم بيانات التدريب إلى مجموعات تدريب واختبار في TensorFlow.js؟
- ما هو الغرض من TensorFlow.js في بناء شبكة عصبية لمهام التصنيف؟