تعد جداول AutoML أداة قوية للتعلم الآلي تقدمها Google Cloud والتي تتيح للمستخدمين إنشاء نماذج التعلم الآلي ونشرها دون الحاجة إلى خبرة واسعة في البرمجة أو علوم البيانات. يقوم بأتمتة عملية هندسة الميزات واختيار النموذج وضبط المعلمة الفائقة وتقييم النموذج ، مما يجعله في متناول المستخدمين بمستويات مختلفة من معرفة التعلم الآلي.
عندما يتعلق الأمر بأنواع البيانات ، يمكن لجداول AutoML التعامل مع مجموعة واسعة من أنواع البيانات المنظمة. تشير البيانات المهيكلة إلى البيانات المنظمة بتنسيق جدولي ، مع صفوف تمثل مثيلات أو أمثلة وأعمدة تمثل ميزات أو متغيرات. يمكن لجداول AutoML التعامل مع كل من أنواع البيانات العددية والفئوية ، مما يتيح للمستخدمين العمل مع مجموعات البيانات المتنوعة.
1. البيانات العددية: تدعم جداول AutoML أنواع البيانات الرقمية المختلفة ، بما في ذلك الأعداد الصحيحة وأرقام الفاصلة العائمة. أنواع البيانات هذه مناسبة لتمثيل القيم العددية المستمرة أو المنفصلة. على سبيل المثال ، إذا كانت لدينا مجموعة بيانات لأسعار المساكن ، فسيتم تمثيل عمود السعر كنوع بيانات رقمي.
2. البيانات الفئوية: تدعم جداول AutoML أيضًا أنواع البيانات الفئوية ، والتي تمثل قيمًا منفصلة تقع في فئات محددة. يمكن تقسيم البيانات الفئوية إلى نوعين فرعيين:
أ. البيانات الاسمية: تمثل البيانات الاسمية الفئات التي ليس لها ترتيب أو تسلسل هرمي متأصل. على سبيل المثال ، إذا كانت لدينا مجموعة بيانات لتعليقات العملاء ، فقد يحتوي عمود المشاعر على فئات مثل "إيجابي" و "محايد" و "سلبي". يمكن لجداول AutoML التعامل مع مثل هذه البيانات الفئوية الاسمية.
ب. البيانات الترتيبية: تمثل البيانات الترتيبية الفئات التي لها ترتيب أو تسلسل هرمي معين. على سبيل المثال ، إذا كانت لدينا مجموعة بيانات لتصنيفات الأفلام ، فيمكن أن يحتوي عمود التصنيف على فئات مثل "ضعيف" و "عادل" و "جيد" و "ممتاز". يمكن لجداول AutoML التعامل مع مثل هذه البيانات الفئوية الترتيبية وتأخذ في الاعتبار ترتيب الفئات أثناء تدريب النموذج.
3. بيانات نصية: توفر جداول AutoML أيضًا دعمًا لبيانات النص. عادةً ما تكون البيانات النصية غير منظمة وتتطلب معالجة مسبقة لتحويلها إلى تنسيق منظم مناسب للتعلم الآلي. يمكن أن تتعامل جداول AutoML مع البيانات النصية من خلال استخدام تقنيات مثل تضمين النص أو تمثيل كيس الكلمات. على سبيل المثال ، إذا كانت لدينا مجموعة بيانات لمراجعات العملاء ، فيمكن تحويل نص المراجعة إلى ميزات رقمية باستخدام تقنيات مثل تضمين الكلمات ، والتي يمكن استخدامها بعد ذلك بواسطة جداول AutoML للتدريب على النموذج.
4. بيانات السلاسل الزمنية: يمكن لجداول AutoML التعامل مع بيانات السلاسل الزمنية ، وهي البيانات التي يتم جمعها عبر سلسلة من الفواصل الزمنية. يتم العثور على بيانات السلاسل الزمنية بشكل شائع في مجالات مختلفة مثل المالية والتنبؤ بالطقس وتحليل سوق الأوراق المالية. يمكن لجداول AutoML معالجة بيانات السلاسل الزمنية من خلال دمج الميزات المتعلقة بالوقت مثل الطوابع الزمنية والمتغيرات المتأخرة.
يمكن أن تتعامل جداول AutoML مع مجموعة واسعة من أنواع البيانات المنظمة ، بما في ذلك البيانات الرقمية والفئوية (الاسمية والترتيبية) والنصية وبيانات السلاسل الزمنية. يتيح هذا التنوع للمستخدمين الاستفادة من قوة جداول AutoML لمجموعة متنوعة من مهام التعلم الآلي عبر مجالات مختلفة.
أسئلة وأجوبة أخرى حديثة بخصوص جداول AutoML:
- لماذا تم إيقاف جداول AutoML وما الذي يخلفها؟
- كيف يمكن للمستخدمين نشر نموذجهم والحصول على تنبؤات في جداول AutoML؟
- ما هي الخيارات المتاحة لإعداد ميزانية التدريب في جداول AutoML؟
- ما المعلومات التي توفرها علامة التبويب "تحليل" في جداول AutoML؟
- كيف يمكن للمستخدمين استيراد بيانات التدريب الخاصة بهم إلى جداول AutoML؟