لمنافسة “سورا”.. جوجل تكشف عن Veo 2 نموذج توليد الفيديو الجديد!
3 د
يُنتج Veo 2 مقاطع بدقة 4K ومدة تتجاوز دقيقتين متفوقًا على Sora.
تقتصر قدرات VEO 2 حاليًا على 8 ثوانٍ بدقة 720p ضمن أداة VideoFX التجريبية.
يتميّز النموذج بمحاكاة دقيقة للسوائل والإضاءة وتعابير الوجه البشرية.
تواجه Google تحديات تتعلق بحقوق البيانات واتساق المحتوى رغم استخدام تقنية SynthID لضمان الأمان.
في خطوة تعكس الطموح المتزايد لشركة Google في سباق الذكاء الاصطناعي، كشفت DeepMind، ذراعها البحثي المتخصص في الذكاء الاصطناعي، عن نموذجها الجديد Veo 2. يُعد هذا النموذج نقلة نوعية في تقنيات إنشاء مقاطع الفيديو بالذكاء الاصطناعي، حيث يقدّم دقة فائقة وقدرة محسّنة على محاكاة العالم الواقعي. هذه الخطوة تأتي بعد النجاح الأولي لـ Veo 1، وتضع DeepMind في مواجهة مباشرة مع Sora، النموذج المنافس من OpenAI.
دقة 4K ومقاطع تصل لدقيقتين: نقلة نوعية
يتميّز Veo 2 بقدرته على إنتاج مقاطع فيديو تمتد لأكثر من دقيقتين بدقة تصل إلى 4K (4096 x 2160). بالمقارنة مع Sora، الذي يقتصر على 20 ثانية ودقة 1080p، فإن Veo 2 يُظهر تفوقًا ملحوظًا على الورق.
ومع ذلك، ما زالت هذه الإمكانيات قيد الاختبار. حاليًا، تقتصر قدرات Veo 2 داخل أداة VideoFX التجريبية من Google على إنتاج مقاطع مدتها 8 ثوانٍ بدقة 720p. هذا الفارق يشير إلى أن DeepMind لا تزال بحاجة لوقت قبل تحقيق إمكاناتها الكاملة.
صرّح إيلي كولينز، نائب رئيس المنتجات في DeepMind، قائلاً: "نعمل على توسيع قدرات النموذج بناءً على تعليقات المستخدمين. على المدى القريب، نخطط لإتاحة Veo 2 عبر منصة Vertex AI للمطورين، مع التأكد من استعداده للاستخدام على نطاق واسع."
قدرات محسّنة واهتمام بالتفاصيل
ما يميّز Veo 2 عن سابقيه هو تركيزه على التفاصيل الدقيقة ومحاكاة الفيزياء الواقعية. إليك أبرز التطورات:
- محاكاة السوائل والضوء: يمكن للنموذج توليد مشاهد تحاكي حركة السوائل بتفاصيل دقيقة، مثل سكب الشراب، مع انعكاسات وظلال واقعية.
- تحكم سينمائي في الكاميرا: تتيح تقنيات Veo 2 تحريك الكاميرا الافتراضية بزوايا متعددة وبدقة عالية لالتقاط المشاهد من منظور سينمائي جذّاب.
- تعابير الوجه البشرية: يحسّن Veo 2 تمثيل التعابير البشرية والانفعالات، مما يجعله أقرب للواقعية.
- جودة واضحة في الحركة: حتى المشاهد التي تتضمن حركة سريعة أصبحت أكثر وضوحًا وتماسكًا.
رغم هذه التطورات، أقر كولينز أن هناك تحديات ما زالت قائمة، أبرزها الحفاظ على الاتساق عبر المقاطع الطويلة وتجنّب التكرار أو الأخطاء في التفاصيل.
الفنانون في قلب التجربة
بالتوازي مع التطوير التقني، حرصت DeepMind على التعاون المباشر مع مبدعين وفنانين لفهم احتياجاتهم. ومن بين الأسماء التي شاركت في اختبار Veo: الفنان دونالد غلوفر والموسيقي The Weeknd. هذه الشراكات تُظهر التزام Google بتقديم أدوات فعّالة تعزز الابتكار الفني.
قال كولينز: "نحن نعتبر المبدعين جزءًا أساسيًا من عملية تطوير أدواتنا. تعاوننا معهم ساهم في تحسين Veo 2 ليكون أقرب إلى تحقيق رؤيتهم الفنية."
تحديات الأمان وحقوق الاستخدام
فيما يتعلق بمسألة البيانات التدريبية، رفضت DeepMind الإفصاح عن مصادر الفيديوهات المستخدمة لتدريب النموذج، لكن الاحتمال الأكبر يشير إلى YouTube نظرًا لملكية Google للمنصة. يُعتبر هذا الملف حساسًا، خاصة مع تزايد الدعاوى القضائية ضد شركات الذكاء الاصطناعي لاستخدامها محتوى إبداعيًا دون إذن مسبق.
للحد من المخاطر المحتملة، تعتمد Google على تقنية العلامات المائية SynthID، التي تُضيف علامات غير مرئية لكل إطار من مقاطع الفيديو المولدة. ومع ذلك، فإن هذه التقنية ليست منيعة تمامًا ضد التلاعب.
تحسينات إضافية: Imagen 3
بالتزامن مع إطلاق Veo 2، أعلنت Google أيضًا عن تحديث جديد لنموذج Imagen 3 المتخصص في إنتاج الصور. يمكن للنموذج الآن إنتاج صور أكثر إشراقًا وتفاصيل غنية ضمن أنماط مختلفة، مثل الواقعية والانطباعية وفن الأنمي. كما تم تحديث واجهة أداة ImageFX لتسهيل تجربة المستخدم.
إطلاق Veo 2 يمثّل خطوة جادة من Google لتعزيز وجودها في سوق تقنيات الذكاء الاصطناعي للفيديو، ولكن لا يزال هناك تحديات تقنية وقانونية أمام تحقيق الانتشار الواسع. التعاون مع الفنانين والتركيز على تحسين الجودة يُظهر رغبة حقيقية في توفير أدوات إبداعية متقدمة، مع الحفاظ على التوازن بين الابتكار والمسؤولية.
أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية
بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك
عبَّر عن رأيك
إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.