الإمارات العربية المتحدة تطلق نموذج اللغة العربية الكبير في الخليج
للدفع نحو الذكاء الاصطناعي

ترجمات-حمزة البحيصي
أطلقت مجموعة ذكاء اصطناعي لها صلات بالعائلة الحاكمة في أبو ظبي ما وصفته بأنه برنامج الذكاء الاصطناعي العربي الأعلى جودة في العالم، في الوقت الذي تمضي فيه دولة الإمارات العربية المتحدة قدما في الجهود الرامية إلى قيادة اعتماد منطقة الخليج للذكاء الاصطناعي التوليدي.
وحسب المجموعة فإن نموذج اللغة الكبير المعروف باسم جيس ( Jais ) هو نموذج مفتوح المصدر وثنائي اللغة ومتاح للاستخدام من قبل أكثر من 400 مليون متحدث باللغة العربية في العالم، وهو مبني على مجموعة كبيرة من البيانات باللغتين العربية والإنجليزية.
والنموذج، الذي تم الكشف عنه يوم الأربعاء، عبارة عن تعاون بين شركة G42، وهي شركة تعمل في مجال الذكاء الاصطناعي ويرأسها مستشار الأمن القومي الإماراتي الشيخ طحنون بن زايد آل نهيان؛ وجامعة محمد بن زايد للذكاء الاصطناعي في أبوظبي (MBZUAI)؛ وCerebras، وهي شركة متخصصة في الذكاء الاصطناعي ومقرها كاليفورنيا.
ويأتي هذا الإطلاق في الوقت الذي تقوم فيه دولة الإمارات العربية المتحدة والمملكة العربية السعودية بشراء الآلاف من رقائق نفيديا عالية الأداء اللازمة لبرامج الذكاء الاصطناعي وسط اندفاع عالمي لتأمين الإمدادات لدعم تطوير الذكاء الاصطناعي.
وسبق لدولة الإمارات العربية المتحدة أن طورت نموذجاً لغوياً كبيراً مفتوح المصدر (LLM)، يُعرف باسم Falcon، في معهد الابتكار التكنولوجي المملوك للدولة في مدينة مصدر بأبو ظبي، باستخدام أكثر من 300 شريحة نفيديا. في وقت سابق من هذا العام، وقعت شركة Cerebras صفقة بقيمة 100 مليون دولار لتزويد تسعة أجهزة كمبيوتر عملاقة لشركة G42، وهو أحد أكبر العقود من نوعها لمنافس محتمل لنفيديا.
قال أندرو جاكسون، الرئيس التنفيذي لـ Inception إن دولة الإمارات العربية المتحدة رائدة في هذا مجال الذكاء الاصطناعي، ونأمل أن نكون متقدمين على اللعبة.
اقرأ/ي أيضا: غوغل تعتزم دمج الذكاء الاصطناعي في خدماتها للحوسبة السحابية
وأضاف: “ننظر إلى هذا باعتباره سباقاً عالمياً، تركز معظم برامج LLM على اللغة الإنجليزية. اللغة العربية هي واحدة من أكبر اللغات في العالم”.
أداء جيس ( Jais ) أفضل من Falcon، إضافة إلى النماذج مفتوحة المصدر مثل LLaMA، عند قياس دقتها باللغة العربية، وفقًا لمبدعيها.
ومع ذلك، قال مطورو Falcon إن برمجياتهم لم يتم تدريبها مسبقًا باللغة العربية. وقال البروفيسور تيموثي بالدوين، القائم بأعمال عميد جامعة محمد بن زايد للذكاء الاصطناعي، إن جيس ( Jais ) تم تصميمه أيضاً للحصول على فهم أكثر دقة لثقافة وسياق المنطقة، على عكس معظم النماذج التي تركز على الولايات المتحدة.
وأضاف أنه تم إنشاء حواجز الحماية للتأكد من أن جايس ( Jais ) “لا يخرج عن الحدود المعقولة من حيث الحساسيات الثقافية والدينية”.
وأشار أنه قبل إطلاقه، تم إجراء اختبارات مكثفة للتخلص من المحتوى “الضار” أو “الحساس”، وكذلك “المخرجات المسيئة أو غير المناسبة التي لا تمثل قيم المنظمات المشاركة في تطوير النموذج”.
وفق القائمين فإنه تم تسمية جيس ( Jais ) على اسم أعلى جبل في دولة الإمارات العربية المتحدة، وقد تم تدريبه على مدار 21 يوماً على مجموعة فرعية من الكمبيوتر العملاق Condor Galaxy 1 AI من شركة Cerebras على يد فريق في أبو ظبي. وتعاونت مجموعة G42 مع كيانات أخرى في أبو ظبي كشركاء إطلاق لاستخدام هذه التكنولوجيا، بما في ذلك شركة بترول أبو ظبي الوطنية، وصندوق الثروة المبادلة، والاتحاد للطيران.
وكان أحد التحديات في تدريب النموذج هو الافتقار إلى بيانات عالية الجودة باللغة العربية على الإنترنت، مقارنة باللغة الإنجليزية. يستخدم جيس ( Jais ) اللغة العربية الفصحى الحديثة، والتي يتم فهمها في جميع أنحاء الشرق الأوسط، بالإضافة إلى اللهجات المنطوقة المتنوعة في المنطقة من خلال الاعتماد على كل من الوسائط ووسائل التواصل الاجتماعي والرموز.
وقال البرفسور بالدوين: “من الواضح أن جيس ( Jais ) أفضل من أي شيء آخر باللغة العربية، وفي اللغة الإنجليزية، تظهر المقارنات أننا قادرون على المنافسة أو حتى أفضل قليلاً في المهام المختلفة مقارنة بالنماذج الحالية”.
المصدر: فايننشال تايمز