لاستخراج التسميات برمجيًا من الصور باستخدام Python وVision API، يمكنك الاستفادة من الإمكانات القوية لـ Google Cloud Vision API. توفر Vision API مجموعة شاملة من ميزات تحليل الصور، بما في ذلك اكتشاف الملصقات، مما يسمح لك بتحديد الملصقات واستخراجها تلقائيًا من الصور.
للبدء، ستحتاج إلى إعداد مشروع Google Cloud وتمكين Vision API. بمجرد الانتهاء من ذلك، يمكنك تثبيت مكتبات بايثون المطلوبة عن طريق تشغيل الأمر التالي:
python pip install google-cloud-vision
بعد ذلك، تحتاج إلى مصادقة التطبيق الخاص بك للوصول إلى Vision API. يمكنك القيام بذلك عن طريق إنشاء مفتاح حساب خدمة وتعيين متغير البيئة `GOOGLE_APPLICATION_CREDENTIALS` للإشارة إلى مسار ملف المفتاح. ويمكن القيام بذلك باستخدام الكود التالي:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
يمكنك الآن استخدام Vision API لاستخراج التسميات من الصور برمجيًا. يوضح مقتطف التعليمات البرمجية التالي كيفية القيام بذلك:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
في هذا الكود، نقوم أولاً بإنشاء مثيل للفئة `ImageAnnotatorClient` من مكتبة `google.cloud.vision`. نقرأ بعد ذلك ملف الصورة، وننشئ كائن "صورة" من محتوى الملف، ونرسله إلى Vision API لاكتشاف التسمية. تحتوي استجابة واجهة برمجة التطبيقات (API) على قائمة بالتعليقات التوضيحية للتسميات، والتي نستخرج منها أوصاف التسميات.
يمكنك الآن استدعاء الدالة "extract_labels" عن طريق تمرير المسار إلى ملف الصورة الذي تريد تحليله. سيعود قائمة التسميات المستخرجة من الصورة.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
سيؤدي هذا إلى إخراج التسميات المستخرجة من الصورة.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
تستخدم Vision API نماذج التعلم الآلي المتقدمة لتحليل الصور وتحديد الكائنات والمشاهد والميزات المرئية الأخرى. يمكنه الكشف بدقة عن مجموعة واسعة من الملصقات، مما يجعله أداة قيمة لمختلف التطبيقات مثل تصنيف الصور والإشراف على المحتوى والبحث المرئي.
لاستخراج التسميات برمجيًا من الصور باستخدام Python وVision API، تحتاج إلى إعداد مشروع Google Cloud، وتمكين Vision API، وتثبيت مكتبات Python المطلوبة، ومصادقة التطبيق الخاص بك، ثم استخدام Vision API لإجراء اكتشاف الملصقات على الصور. يمكن استخدام التسميات المستخرجة لمزيد من التحليل أو لتعزيز فهم محتوى الصورة.
أسئلة وأجوبة أخرى حديثة بخصوص واجهة برمجة تطبيقات Google Vision EITC/AI/GVAPI:
- ما هي بعض الفئات المحددة مسبقًا للتعرف على الكائنات في Google Vision API؟
- هل تعمل Google Vision API على تمكين التعرف على الوجه؟
- كيف يمكن إضافة نص العرض إلى الصورة عند رسم حدود الكائن باستخدام وظيفة "draw_vertices"؟
- ما هي معلمات طريقة "draw.line" في الكود المقدم، وكيف يتم استخدامها لرسم الخطوط بين قيم القمم؟
- كيف يمكن استخدام مكتبة الوسائد لرسم حدود الكائنات في بايثون؟
- ما هو الغرض من وظيفة "draw_vertices" في الكود المقدم؟
- كيف يمكن لـ Google Vision API المساعدة في فهم الأشكال والكائنات في الصورة؟
- كيف يمكن للمستخدمين استكشاف الصور المشابهة بصريًا التي توصي بها واجهة برمجة التطبيقات؟
- ما العناصر المختلفة المتوفرة في كائن الاستجابة لميزة اكتشاف الويب الخاصة بـ Google Vision API؟
- كيف تساعد ميزة اكتشاف الويب في إنشاء علامات للصور التي تم تحميلها؟
عرض المزيد من الأسئلة والأجوبة في EITC/AI/GVAPI Google Vision API