جوجل تكشف عن نموذج ذكاء صناعي لتوليد الفيديو

كشفت شركة جوجل الأمريكية عن نموذجها اللغوي الجديد لتوليد الفيديو المسمى “فيديو بويت” VideoPoet.
النموذج، وفق افصاح للشركة، مصمم لأداء مجموعة من المهام، مثل تحويل النص إلى فيديو، وتحويل الصورة إلى فيديو، وتحويل الفيديو إلى صوت.

ويتميز النموذج الجديد من خلال إدماج القدرات المتعددة لتوليد الفيديو في إطار نموذجي لغوي كبير واحد.

ويستخدم النموذج طرقًا متعدددة، وهو مدرب لاستخدام العديد من الرموز المميزة، كما يؤدي مهام متنوعة، بدءًا من تحريك الصور وتحرير الفيديوهات وتصميمها استنادًا إلى مدخلات النص.

ويتيح أيضا درجة عالية من الدقة في ترجمة المطالبات النصية إلى فيديو.

والأسبوع الماضي، أطلقت جوجل رسميا، تقنية (Imagen 2) لتوليد الصور باستخدام الذكاء الصناعي مع تحسينات واسعة مقارنة بإصدارها الأول.

 

وتوظف تقنية (Imagen 2) آليات الذكاء الصناعي في تحويل النص إلى صورة، وقد أصبحت متاحة الآن على نطاق واسع لعملاء (Vertex AI)، وهي منصة تابعة لجوجل تضم مجموعة من المنتجات والخدمات السحابية المعتمدة على الذكاء الصناعي، والموجهة بصورة أساسية إلى الشركات.

جوجل نجحت في اجتذاب العديد من الشركات بالفعل لاستخدام تقنية Imagen، ومنها Shutterstock وسناب شات وغيرها.

 

وقالت الشركة في بيان على موقعها الإلكتروني، إن تقنية Imagen 2 باتت تولد صورا ذات جودة عالية، مع قدرة على إنتاج النصوص داخل الصور بلغات إضافية، بالإضافة إلى إنشاء الشعارات، وغير ذلك”.

وأضافت أن التقنية الجديدة تتيح إمكانية إنشاء وصف نصي للصور، كما أنها تضيف علامة مائية مميزة للصور التي تولد منخلالها من أجل تمييزها عن الصور الواقعية .

وتحاول جوجل من خلال تلك التقنية منافسة نموذج DALL-E 3 من شركة OpenAI، الذي يتيح كذلك تحويل الأوامر النصية إلى صور باستخدام الذكاء الصناعي.

 

الرابط المختصر: https://msheireb.co/1aa