إذا أراد المرء التعرف على الصور الملونة على شبكة عصبية تلافيفية، فهل يتعين عليه إضافة بُعد آخر عند التعرف على الصور ذات المقياس الرمادي؟

by ديميتريوس افستاثيو / الخميس، 14 مارس 2024 / نشرت في الذكاء الاصطناعي, التعلم العميق لـ EITC/AI/DLPP باستخدام Python و PyTorch, المُقدّمة, مقدمة للتعلم العميق باستخدام Python و Pytorch

عند العمل مع الشبكات العصبية التلافيفية (CNN) في مجال التعرف على الصور، من الضروري فهم الآثار المترتبة على الصور الملونة مقابل الصور ذات التدرج الرمادي. في سياق التعلم العميق مع Python وPyTorch، يكمن التمييز بين هذين النوعين من الصور في عدد القنوات التي تمتلكها.

تحتوي الصور الملونة، التي يتم تمثيلها عادة بتنسيق RGB (الأحمر والأخضر والأزرق)، على ثلاث قنوات تتوافق مع شدة كل قناة لون. من ناحية أخرى، تحتوي الصور ذات التدرج الرمادي على قناة واحدة تمثل شدة الضوء عند كل بكسل. يتطلب هذا الاختلاف في عدد القنوات إجراء تعديلات في أبعاد الإدخال عند تغذية هذه الصور في شبكة CNN.

وفي حالة التعرف على الصور الملونة، يجب مراعاة بُعد إضافي مقارنة بالتعرف على الصور ذات التدرج الرمادي. في حين يتم تمثيل الصور ذات التدرج الرمادي عادةً كموترات ثنائية الأبعاد (الارتفاع × العرض)، يتم تمثيل الصور الملونة كموترات ثلاثية الأبعاد (الارتفاع × العرض × القنوات). لذلك، عند تدريب CNN على التعرف على الصور الملونة، يجب تنظيم بيانات الإدخال بتنسيق ثلاثي الأبعاد لمراعاة قنوات الألوان.

على سبيل المثال، دعونا نفكر في مثال بسيط لتوضيح هذا المفهوم. لنفترض أن لديك صورة ملونة بأبعاد 100 × 100 بكسل. في تنسيق RGB، سيتم تمثيل هذه الصورة كموتر بأبعاد 100x100x3، حيث يتوافق البعد الأخير مع قنوات الألوان الثلاثة. عند تمرير هذه الصورة عبر CNN، يجب تصميم بنية الشبكة لقبول بيانات الإدخال بهذا التنسيق ثلاثي الأبعاد للتعلم بشكل فعال من معلومات الألوان الموجودة في الصورة.

في المقابل، إذا كنت تعمل مع صور ذات تدرج رمادي بنفس الأبعاد، فسيكون موتر الإدخال 100×100، ويحتوي على قناة واحدة فقط تمثل شدة الضوء. في هذا السيناريو، سيتم تكوين بنية CNN لقبول بيانات الإدخال ثنائية الأبعاد دون الحاجة إلى بُعد قناة إضافي.

لذلك، للتعرف بنجاح على الصور الملونة على شبكة عصبية تلافيفية، من الضروري ضبط أبعاد الإدخال لاستيعاب معلومات القناة الإضافية الموجودة في الصور الملونة. من خلال فهم هذه الاختلافات وتنظيم بيانات الإدخال بشكل مناسب، يمكن لشبكات CNN الاستفادة بشكل فعال من معلومات الألوان لتعزيز مهام التعرف على الصور.

أكاديمية EITCA

إذا أراد المرء التعرف على الصور الملونة على شبكة عصبية تلافيفية، فهل يتعين عليه إضافة بُعد آخر عند التعرف على الصور ذات المقياس الرمادي؟

أسئلة وأجوبة أخرى حديثة بخصوص التعلم العميق لـ EITC/AI/DLPP باستخدام Python و PyTorch:

المزيد من الأسئلة والأجوبة:

أكاديمية EITCA هي جزء من إطار عمل شهادة تكنولوجيا المعلومات الأوروبية

الأهلية للحصول على دعم دعم EITCI DSJC بنسبة 80٪

أكاديمية EITCA

قم بتسجيل الدخول إلى حسابك عن طريق اسم المستخدم الخاص بك أو عنوان البريد الإلكتروني

نسى التفاصيل الخاصة بك؟

إنشاء حساب

إذا أراد المرء التعرف على الصور الملونة على شبكة عصبية تلافيفية، فهل يتعين عليه إضافة بُعد آخر عند التعرف على الصور ذات المقياس الرمادي؟

أسئلة وأجوبة أخرى حديثة بخصوص التعلم العميق لـ EITC/AI/DLPP باستخدام Python و PyTorch:

المزيد من الأسئلة والأجوبة:

الأهلية للحصول على دعم دعم EITCI DSJC بنسبة 80٪