أصدر باحثون من آبل نموذجاً جديداً مفتوح المصدر للذكاء الاصطناعي يتيح للمستخدمين تحرير وتعديل الصور بناءً على تعليمات اللغة الطبيعية دون استخدام برنامج تحرير الصور.

ويستطيع نموذج “MGIE” قص الصور وتغيير حجمها وقلبها وإضافة مرشحات إليها من خلال المطالبات النصية، ويستفيد النموذج من النماذج اللغوية الكبيرة المتعددة الوسائط من أجل تفسير أوامر المستخدم وإجراء عمليات معالجة على مستوى البكسل.

وتعاونت شركة آبل الأميركية مع جامعة “كاليفورنيا سانتا باربرا” لتطوير نموذج “MGIE” القادر على أداء مهام تحرير الصور البسيطة والمعقد، مثل تعديل كائنات معينة في الصورة لجعلها ذات شكل مختلف أو زيادة سطوعها.

ويمزج النموذج بين استخدامين مختلفين للنماذج اللغوية الكبيرة المتعددة الوسائط، إذ يتعلم كيفية تفسير مطالبات المستخدم ومن ثم يتخيل الشكل الذي يبدو عليه التعديل.

§

تحرير الصور بالوصف

§

ويحتاج المستخدم إلى كتابة ما يريد تغييره في الصورة عند تحرير صورة باستخدام نموذج “MGIE”.

وتوضح الورقة فعالية “MGIE” في تحسين المقاييس التلقائية والتقييم البشري، مع الحفاظ على كفاءة الاستدلال التنافسي.

وقال باحثو آبل في الورقة البحثية: “يستمد نموذج MGIE نية واضحة واعية بصرياً بدلاً من التوجيهات الموجزة والغامضة، مما يؤدي إلى تحرير الصور بطريقة معقولة”.

ويجري باحثو آبل دراسات مكثفة من مختلف جوانب التحرير لإثبات أن نموذج “MGIE” يحسن الأداء بفعالية مع الحفاظ على الكفاءة التنافسية.

§

كيفية تنزيل نموذج “MGIE”؟

§

وأتاحت آبل نموذج “MGIE” للتنزيل من خلال GitHub، إذ يمكن للمستخدمين العثور على التعليمات البرمجية والبيانات والنماذج المدربة سابقاً.

وتوفر الشركة عرضاً تجريبياً يوضح كيفية استخدام “MGIE” لمهام التحرير المختلفة، ويمكن للمستخدمين أيضاً تجربة “MGIE” من خلال عرض توضيحي عبر الويب مستضاف ضمن Hugging Face Spaces، وهي منصة للمشاركة والتعاون في مشاريع التعلم الآلي.

 

ولا تعد آبل مشهورة في مجال الذكاء الاصطناعي التوليدي، على عكس مايكروسوفت وميتا وغوغل، مع أن الرئيس التنفيذي للشركة، تيم كوك، قال إن آبل تريد إضافة المزيد من مزايا الذكاء الاصطناعي إلى أجهزتها هذا العام.

وأصدر باحثو آبل في شهر كانون الأول إطار عمل مفتوح المصدر للتعلم الآلي يسمى MLX لتسهيل تدريب نماذج الذكاء الاصطناعي على شرائح Apple Silicon.