أبوظبي في 9 ديسمبر /وام/ أعلنت كل من شركة "إنسيبشن" التابعة لمجموعة "جي 42"، وشركة "سيريبراس سيستمز"، ومعهد النماذج التأسيسية في جامعة محمد بن زايد للذكاء الاصطناعي، اليوم، عن إطلاق "جيس 2"، النموذج اللغوي العربي الكبير مفتوح الوزن الأكثر تقدما في العالم.

وجرى تطوير "جيس 2" من الصفر باستخدام 70 مليار مُعامل متغيّر، وتدريبه على أكبر وأغنى قاعدة بيانات عربية المنشأ حتى اليوم، وسيكون "جيس 2" متاحًا للتنزيل عبر منصة "HuggingFace" التابعة لشركة "إنسيبشن"، إضافةً إلى الموقع الإلكتروني.

ويأتي "جيس 2" مدعومًا بهيكلية معاد تصميمها وببيانات تدريب أنقى وأكثر تنظيمًا، ما يمنحه قدرات أقوى في الاستدلال، وسلاسة أكبر في اللغة العربية الفصحى واللهجات الإقليمية، إلى جانب أداء قوي في اللغة الإنجليزية، وقد تم تصميمه للتعامل مع السلوك اللغوي الواقعي، بما في ذلك التناوب اللغوي والأسلوب غير الرسمي، مع الحفاظ على قدرات تقنية وإبداعية متقدمة.

كما يدمج النموذج إطارًا شاملًا للسلامة يعتمد على ضبط التعليمات، والتقييم، وردود المستخدمين بشكل مستمر، لضمان بقائه موثوقًا وقابلًا للتكيّف مع مرور الوقت.

وأثبت "جيس 2" أداءً قويًا عبر مجموعة واسعة من المحتوى يشمل الشعر العربي، والثقافة، ولغة وسائل التواصل الاجتماعي، ليقدّم نموذجًا يعكس العربية كما تُستخدم يوميًا في المحادثات والثقافة والتعبير المعاصر.

وقالت آشيش كوشي، الرئيس التنفيذي لشركة "إنسيبشن": "عانت النماذج العربية طويلًا من محدودية البيانات وتشتت مصادرها، وهو ما انعكس على جودة أدائها، ويأتي "جيس 2" ليقدّم نقلة نوعية حقيقية، مع فهم أعمق للهجات، والنبرات. فهو نموذج يتعامل مع العربية كما يتحدثها الناس ويستخدمونها في حياتهم اليومية. ونحن فخورون بدورنا في تطوير نظام يفتح آفاقًا جديدة للابتكار ويخدم ملايين المستخدمين والمطورين في المنطقة وخارجها".

من جانبها قالت ناتاليا فاسيلييفا، نائب الرئيس والرئيسة التقنية الميدانية في شركة "سيريبراس سيستمز": "يُجسّد "جيس 2" الدور المتنامي الذي تلعبه دولة الإمارات في تطوير أنظمة ذكاء اصطناعي متقدمة ومفتوحة الوزن، ونحن فخورون بأن تدريب النموذج وتشغيله يتمّان عبر أنظمتنا، وبالشراكة مع شركائنا في دولة الإمارات".

وأضافت: "تمكنا من خلال الجمع بين خبراتهم وتقنيات التعلّم الآلي التي تتيحها بنية سيريبراس الفريدة، من تحقيق أداء من الطراز العالمي باستخدام جزء يسير فقط من القدرة الحاسوبية اللازمة عادةً لتدريب نماذج مماثلة بالحجم نفسه"، وقالت إن الزخم الذي تشهده الإمارات في هذا المجال استثنائي، مؤكدة التزام الشركة المتواصل بدعم هذا النظام البيئي عبر حوسبة عالية الكفاءة وتعاون عميق يسهم في تسريع الابتكار وتوسيع الوصول إلى تقنيات الذكاء الاصطناعي عالية الأداء.

من جهته قال بريسلاف ناكوف، أستاذ ورئيس قسم معالجة اللغة الطبيعية في جامعة محمد بن زايد للذكاء الاصطناعي: "لم تحظَ اللغة العربية عبر السنوات بتمثيل كافٍ في مسيرة تطوير الذكاء الاصطناعي، ويرجع ذلك في الأساس إلى محدودية البيانات العالية الجودة اللازمة لبناء نماذج لغوية متقدمة، ومع "جيس 2" نصل إلى مرحلة فاصلة، إذ نقدّم نموذجًا لا يعتمد على الحجم فحسب، بل يقوم على فهم لغوي وثقافي عميق يجعل العربية في صميم تصميمه".

وأوضح: "أتاح لنا توسيع نطاق البيانات العربية وجودتها بناء أساس يعكس ثراء اللغة العربية وتنوّعها، ويُظهر كيف يمكن للذكاء الاصطناعي أن يتطور عندما يُبنى على التوافق الثقافي والسلامة والابتكار المفتوح".