وكالات - مصدر الإخبارية
أعلنت شركة OpenAI عن إطلاق نموذجها الجديد لتوليد الصور ChatGPT Images 2.0، في خطوة وصفتها بأنها تمثل تحولاً جذرياً في صناعة المحتوى البصري المعتمد على الذكاء الاصطناعي، وذلك بفضل قدراته المتقدمة في الفهم البصري، والتعامل مع النصوص داخل الصور، وإنتاج مخرجات أكثر دقة وواقعية.

ويعتمد النموذج الجديد على رؤية تعتبر أن الصورة ليست مجرد عنصر جمالي، بل وسيلة تعبير متكاملة يمكنها نقل الأفكار والمفاهيم بنفس قوة النص المكتوب، من خلال تنظيم العناصر البصرية وإظهارها بطريقة تعكس الفكرة أو الحالة أو الحجة بشكل كامل.
ويمثل ChatGPT Images 2.0 أول نموذج صور داخل منظومة ChatGPT مزود بقدرات “تفكير”، حيث يمكنه عند استخدامه مع نماذج الاستدلال المتقدمة تحليل الطلبات بشكل أعمق، والبحث عبر الإنترنت للحصول على معلومات محدثة، وإنتاج أكثر من صورة في آن واحد، إضافة إلى مراجعة النتائج وتحسينها بشكل ذاتي قبل تقديمها للمستخدم.
كما يتميز النموذج بقدرة محسّنة على اتباع التعليمات الدقيقة، وإظهار تفاصيل معقدة داخل الصور مثل النصوص الصغيرة، الأيقونات، عناصر واجهات المستخدم، والتكوينات البصرية الكثيفة، مع دعم دقة تصل إلى 2K، ما يجعله مناسباً للاستخدامات الاحترافية في التصميم والتسويق والتعليم.

وعلى مستوى اللغات، شهد النموذج تطوراً كبيراً في معالجة النصوص غير اللاتينية، حيث أصبح أكثر دقة في التعامل مع لغات متعددة مثل العربية واليابانية والكورية والصينية والهندية والبنغالية، مع إمكانية إنتاج صور تحتوي على نصوص متكاملة ومتناسقة لغوياً ضمن التصميم نفسه.
وفي ما يتعلق بالأسلوب البصري، أظهر النظام الجديد قدرة أعلى على إنتاج صور واقعية وسينمائية، مع دعم أنماط فنية متنوعة تشمل أسلوب البكسل والمانجا والتصميم التسويقي، مع الحفاظ على التناسق في الإضاءة والتفاصيل والملمس.

كما يتيح ChatGPT Images 2.0 مرونة واسعة في نسب أبعاد الصور، بما يصل إلى 3:1 للأفقية و1:3 للطولية، مع إمكانية استخدام إعدادات مسبقة تناسب مختلف الاستخدامات مثل العروض التقديمية ووسائل التواصل الاجتماعي والملصقات الرقمية.
وأكدت OpenAI أن النموذج الجديد يمتلك قاعدة معرفية محدثة حتى ديسمبر 2025، ما يمنحه قدرة أكبر على إنتاج محتوى بصري مرتبط بالسياق الحالي للأحداث والمعلومات، خصوصاً في التطبيقات التعليمية والتوضيحية.
ويقدم النظام أيضاً تجربة إنتاج متكاملة تبدأ من تحليل الفكرة وتجميع المعلومات وكتابة النصوص، وصولاً إلى تحويلها إلى تصميم بصري منسق، مع تقليل الحاجة إلى التدخل اليدوي من المستخدم.
ويمثل هذا الإصدار خطوة متقدمة في اتجاه تحويل أدوات الذكاء الاصطناعي من مجرد مولدات صور إلى شركاء إبداعيين قادرين على دعم عملية التفكير والإنتاج البصري بشكل شامل، في وقت تتسارع فيه المنافسة بين الشركات العالمية في هذا المجال.
