غوغل تعلن عن نموذج Veo لتوليد الفيديوهات من النصوص بالذكاء الاصطناعي

في إطار فعاليات مؤتمر المطورين Google I/O 2024، أعلنت شركة غوغل عن نموذجها الجديد للذكاء الاصطناعي المسمى Veo. يتميز هذا النموذج بقدرته على إنشاء مقاطع فيديو عالية الجودة استنادًا إلى المطالبات النصية للمستخدمين.

نموذج Veo لتوليد مقاطع الفيديو بالذكاء الاصطناعي

تعتبر جوجل أن نموذج Veo متقدم للغاية في فهم اللغة الطبيعية والمعاني البصرية، مما يتيح له إنتاج فيديوهات تلبي توقعات المستخدمين بدقة تصل إلى 1080 بكسل ومدة تتجاوز الدقيقة الواحدة. كما يفهم النموذج تقنيات السينما والرؤية بشكل عميق، مثل مفهوم الفاصل الزمني.

لتوضيح قدرات نموذج Veo، عملت جوجل بالتعاون مع صانع الأفلام دونالد جلوفر واستوديوهات Gilga، حيث قدموا فيديو ترويجي يظهر قدرات النموذج في محاكاة فيزياء العالم الحقيقي.

سيكون نموذج Veo متاحًا اليوم ضمن أداة VideoFX من جوجل لبعض منشئي المحتوى، كما سيتم إضافته إلى يوتيوب Shorts ومنتجات أخرى تابعة للشركة.

بالإضافة إلى ذلك، أعلنت جوجل عن نموذج آخر يحمل اسم Imagen 3، وهو نموذج متطور لتحويل النص إلى صورة، وتدعي الشركة أنه الأعلى جودة في هذا المجال، مع درجة عالية من التفاصيل والواقعية.

تتطلع المجتمع التقني بشغف لاختبار النماذج الجديدة من جوجل، ومقارنتها بنماذج شركة OpenAI المنافسة مثل Sora لتحويل النص إلى فيديو و DALL-E 3 لتحويل النص إلى صور.

غوغل تعلن عن نموذج Veo لتوليد الفيديوهات من النصوص بالذكاء الاصطناعي

نموذج Veo لتوليد مقاطع الفيديو بالذكاء الاصطناعي

إرسال تعليق

نموذج الاتصال