كيف يمكنك استخراج التسميات برمجياً من الصور باستخدام Python وVision API؟

by أكاديمية EITCA / الأربعاء، 27 ديسمبر 2023 / نشرت في الذكاء الاصطناعي, واجهة برمجة تطبيقات Google Vision EITC/AI/GVAPI, تسمية الصور, كشف الملصقات, مراجعة الامتحان

لاستخراج التسميات برمجيًا من الصور باستخدام Python وVision API، يمكنك الاستفادة من الإمكانات القوية لـ Google Cloud Vision API. توفر Vision API مجموعة شاملة من ميزات تحليل الصور، بما في ذلك اكتشاف الملصقات، مما يسمح لك بتحديد الملصقات واستخراجها تلقائيًا من الصور.

للبدء، ستحتاج إلى إعداد مشروع Google Cloud وتمكين Vision API. بمجرد الانتهاء من ذلك، يمكنك تثبيت مكتبات بايثون المطلوبة عن طريق تشغيل الأمر التالي:

python
pip install google-cloud-vision

بعد ذلك، تحتاج إلى مصادقة التطبيق الخاص بك للوصول إلى Vision API. يمكنك القيام بذلك عن طريق إنشاء مفتاح حساب خدمة وتعيين متغير البيئة `GOOGLE_APPLICATION_CREDENTIALS` للإشارة إلى مسار ملف المفتاح. ويمكن القيام بذلك باستخدام الكود التالي:

python
import os
from google.cloud import vision

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'

يمكنك الآن استخدام Vision API لاستخراج التسميات من الصور برمجيًا. يوضح مقتطف التعليمات البرمجية التالي كيفية القيام بذلك:

python
def extract_labels(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)
    response = client.label_detection(image=image)
    labels = response.label_annotations

    extracted_labels = [label.description for label in labels]

    return extracted_labels

في هذا الكود، نقوم أولاً بإنشاء مثيل للفئة `ImageAnnotatorClient` من مكتبة `google.cloud.vision`. نقرأ بعد ذلك ملف الصورة، وننشئ كائن "صورة" من محتوى الملف، ونرسله إلى Vision API لاكتشاف التسمية. تحتوي استجابة واجهة برمجة التطبيقات (API) على قائمة بالتعليقات التوضيحية للتسميات، والتي نستخرج منها أوصاف التسميات.

يمكنك الآن استدعاء الدالة "extract_labels" عن طريق تمرير المسار إلى ملف الصورة الذي تريد تحليله. سيعود قائمة التسميات المستخرجة من الصورة.

python
image_path = '/path/to/image.jpg'
labels = extract_labels(image_path)
print(labels)

سيؤدي هذا إلى إخراج التسميات المستخرجة من الصورة.

plaintext
['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']

تستخدم Vision API نماذج التعلم الآلي المتقدمة لتحليل الصور وتحديد الكائنات والمشاهد والميزات المرئية الأخرى. يمكنه الكشف بدقة عن مجموعة واسعة من الملصقات، مما يجعله أداة قيمة لمختلف التطبيقات مثل تصنيف الصور والإشراف على المحتوى والبحث المرئي.

لاستخراج التسميات برمجيًا من الصور باستخدام Python وVision API، تحتاج إلى إعداد مشروع Google Cloud، وتمكين Vision API، وتثبيت مكتبات Python المطلوبة، ومصادقة التطبيق الخاص بك، ثم استخدام Vision API لإجراء اكتشاف الملصقات على الصور. يمكن استخدام التسميات المستخرجة لمزيد من التحليل أو لتعزيز فهم محتوى الصورة.

أكاديمية EITCA

كيف يمكنك استخراج التسميات برمجياً من الصور باستخدام Python وVision API؟

أسئلة وأجوبة أخرى حديثة بخصوص واجهة برمجة تطبيقات Google Vision EITC/AI/GVAPI:

المزيد من الأسئلة والأجوبة:

أكاديمية EITCA هي جزء من إطار عمل شهادة تكنولوجيا المعلومات الأوروبية

الأهلية للحصول على دعم دعم EITCI DSJC بنسبة 80٪

أكاديمية EITCA

قم بتسجيل الدخول إلى حسابك عن طريق اسم المستخدم الخاص بك أو عنوان البريد الإلكتروني

نسى التفاصيل الخاصة بك؟

إنشاء حساب

كيف يمكنك استخراج التسميات برمجياً من الصور باستخدام Python وVision API؟

أسئلة وأجوبة أخرى حديثة بخصوص واجهة برمجة تطبيقات Google Vision EITC/AI/GVAPI:

المزيد من الأسئلة والأجوبة:

الأهلية للحصول على دعم دعم EITCI DSJC بنسبة 80٪