جوجل تطلق نموذج Gemini Omni لإنشاء وتحرير الفيديو بالذكاء الاصطناعي

أعلنت شركة جوجل عن إطلاق نموذجها الجديد للذكاء الاصطناعي Gemini Omni، في خطوة تهدف إلى توسيع قدرات منظومة Gemini في مجال إنتاج المحتوى المرئي، عبر نموذج قادر على إنشاء وتحرير مقاطع الفيديو باستخدام مدخلات متعددة تشمل النصوص والصور والصوت.

وقالت الشركة إن النموذج يمثل تطوراً مهماً في تقنيات الذكاء الاصطناعي متعددة الوسائط، إذ يجمع بين قدرات الفهم السياقي والاستدلال التي تتميز بها نماذج Gemini، وبين إمكانيات إنتاج محتوى مرئي تفاعلي وأكثر إبداعاً.

وبحسب جوجل، فإن Gemini Omni يتيح للمستخدمين إجراء تعديلات على الفيديوهات عبر أوامر مكتوبة باللغة الطبيعية فقط، ما يحول عملية المونتاج التقليدية إلى تجربة تفاعلية تعتمد على المحادثة المباشرة مع النموذج.

وأكدت الشركة أن النموذج قادر على الحفاظ على اتساق الشخصيات والعناصر البصرية داخل المشاهد، حتى عند إجراء تعديلات متكررة، مع إمكانية تغيير البيئة أو إضافة شخصيات جديدة أو إعادة تشكيل الأحداث بشكل كامل داخل الفيديو.

كما أوضحت أن Gemini Omni يدعم تنفيذ تعديلات متتابعة مع الحفاظ على الترابط السردي والبصري، إلى جانب قدرته على فهم أعمق للسياق وما يجب أن يحدث داخل المشهد، مستفيداً من قاعدة معرفة جيميناي في مجالات متعددة مثل التاريخ والعلوم والثقافة.

وأضافت جوجل أن النموذج يتمتع بفهم محسّن لمفاهيم فيزيائية مثل الجاذبية والحركة والطاقة وديناميكيات السوائل، ما ينعكس على جودة واقعية الحركة داخل الفيديوهات المنتجة.

ويمتاز Gemini Omni أيضاً بقدرته على دمج مدخلات متنوعة، سواء كانت نصوصاً أو صوراً أو رسومات أو ملفات صوتية أو مقاطع فيديو مرجعية، وتحويلها إلى مشهد بصري واحد متكامل، مع إمكانية تطبيق أنماط ومؤثرات مختلفة عبر الأوامر النصية.

وكشفت الشركة عن ميزة جديدة باسم “Avatars”، تتيح إنشاء شخصيات رقمية تحاكي صوت المستخدم لاستخدامها في إنتاج الفيديوهات، مع خطط مستقبلية لتوسيع استخدامها بشكل أكبر.

وفي إطار مخاوف التضليل، أكدت جوجل أنها ستدمج تقنية “SynthID” كعلامة مائية رقمية غير مرئية داخل جميع الفيديوهات المنتجة، بهدف التحقق من المحتوى الذي يتم إنشاؤه أو تعديله بالذكاء الاصطناعي، إلى جانب توفير أدوات للتحقق عبر تطبيق Gemini ومتصفح Chrome ومحرك بحث جوجل.

وبدأت جوجل طرح أول إصدار من النموذج تحت اسم Gemini Omni Flash، ليكون متاحاً لمشتركي خطط Google AI Plus وGoogle AI Pro وGoogle AI Ultra عبر تطبيق Gemini ومنصات إنتاج الفيديو، على أن يتم توسيع الإتاحة لاحقاً.

ويأتي هذا الإطلاق في ظل منافسة متسارعة بين شركات التكنولوجيا الكبرى لتطوير أدوات ذكاء اصطناعي قادرة على إنتاج الفيديوهات، في سباق يشمل شركات مثل OpenAI وميتا وغيرها من الشركات الناشئة في هذا المجال.