في إطار فعاليات مؤتمر المطورين Google I/O 2024، أعلنت شركة غوغل عن نموذجها
الجديد للذكاء الاصطناعي المسمى Veo. يتميز هذا النموذج بقدرته على إنشاء مقاطع
فيديو عالية الجودة استنادًا إلى المطالبات النصية للمستخدمين.
نموذج Veo لتوليد مقاطع الفيديو بالذكاء الاصطناعي
تعتبر جوجل أن نموذج Veo متقدم للغاية في فهم اللغة الطبيعية والمعاني البصرية،
مما يتيح له إنتاج فيديوهات تلبي توقعات المستخدمين بدقة تصل إلى 1080 بكسل ومدة
تتجاوز الدقيقة الواحدة. كما يفهم النموذج تقنيات السينما والرؤية بشكل عميق، مثل
مفهوم الفاصل الزمني.
لتوضيح قدرات نموذج Veo، عملت جوجل بالتعاون مع صانع الأفلام دونالد جلوفر
واستوديوهات Gilga، حيث قدموا فيديو ترويجي يظهر قدرات النموذج في محاكاة فيزياء
العالم الحقيقي.
سيكون نموذج Veo متاحًا اليوم ضمن أداة VideoFX من جوجل لبعض منشئي المحتوى، كما
سيتم إضافته إلى يوتيوب Shorts ومنتجات أخرى تابعة للشركة.
بالإضافة إلى ذلك، أعلنت جوجل عن نموذج آخر يحمل اسم Imagen 3، وهو نموذج متطور
لتحويل النص إلى صورة، وتدعي الشركة أنه الأعلى جودة في هذا المجال، مع درجة
عالية من التفاصيل والواقعية.
تتطلع المجتمع التقني بشغف لاختبار النماذج الجديدة من جوجل، ومقارنتها بنماذج
شركة OpenAI المنافسة مثل Sora لتحويل النص إلى فيديو و DALL-E 3 لتحويل النص إلى
صور.