ABU DABİ, 30 AĞUSTOS, 2023 (WAM) --
Yapay zekanın sınırlarını zorlamaya kendini adamış bir G42 şirketi olan Inception, dünyanın en yüksek kaliteli Arapça Büyük Dil Modeli olan "Jais" açık kaynaklı sürümünü duyurdu.
Jais, yeni geliştirilen 395 milyar jetonlu Arapça ve İngilizce veri kümesi üzerinde eğitilmiş 13 milyar parametreli bir modeldir. BAE'nin en yüksek zirvesinden ilham alan bir isimle Jais, üretken AI'nın avantajlarını Arapça konuşulan dünyaya taşıyacak. Model, Inception, Muhammed bin Zayid Yapay Zekâ Üniversitesi (MBZUAI) ve Cerebras Systems arasındaki iş birliğinin sonucudur. G42 ve Cerebras tarafından yakın zamanda duyurulan çoklu exaFLOP AI süper bilgisayarı olan Condor Galaxy'de eğitildi.
Jais'in piyasaya sürülmesi, Arap dünyası için AI alanında önemli bir dönüm noktasına işaret ediyor. BAE'nin başkenti Abu Dabi'de yetiştirilen bir model olup, 400 milyondan fazla Arapça konuşan kişiye üretken yapay zekanın potansiyelinden yararlanma fırsatı sunuyor. Abu Dabi'nin AI, inovasyon, kültürün korunması ve uluslararası iş birliği için bir merkez olarak lider konumunu vurgulayarak inovasyonu kolaylaştıracak ve hızlandıracak.
Inception, Jais'i açık kaynak kullanarak, canlı bir Arapça AI ekosisteminin büyümesini hızlandırmak için bilimsel, akademik ve geliştirici toplulukların katılımını sağlamayı amaçlıyor. Bu, şu anda ana akım yapay zekada yeterince temsil edilmeyen diğer diller için bir model görevi görebilir.
Inception'ın CEO'su Andrew Jackson, "İnovasyonun iş birliği yaptığımızda gelişeceğine inanıyoruz. Bu sürümle, Orta Doğu'da AI gelişimi için yeni bir standart belirliyor ve derinliği ve mirasıyla Arap dilinin AI ortamında sesini bulmasını sağlıyoruz. Jais, mükemmelliğe olan bağlılığımızın ve yapay zekayı demokratikleştirme ve yeniliği teşvik etme konusundaki kararlılığımızın bir kanıtıdır." dedi.
Jais, mevcut Arap modellerini büyük bir farkla geride bırakıyor. Aynı zamanda, önemli ölçüde daha az İngilizce verisi üzerinde eğitilmiş olmasına rağmen, benzer büyüklükteki İngiliz modelleriyle de rekabet halindedir. Bu heyecan verici sonuç, modelin İngilizce bileşeninin Arapça verilerden öğrendiğini ve bunun tersinin de LLM'nin geliştirilmesinde ve eğitiminde yeni bir dönem açtığını gösteriyor.
MBZUAI Başkanı ve Üniversite Profesörü Eric Xing, "Böyle yüksek kalibreli bir Arapça yüksek lisans eğitiminin geliştirilmesi, Arap dilinin, çeşitliliğinin ve mirasının ve toplumun tüm kademelerinde yüksek lisansların giderek artan öneminin derinlemesine ve incelikli bir şekilde anlaşılmasının yanı sıra son teknolojiye sahip AI araştırmalarını da gerektiriyordu. Inception ve diğer üst düzey bölgesel ve küresel kuruluşlarla olan araştırmalarımız ve ortaklıklarımız sayesinde MBZUAI, verimli, etkili ve doğru LLM'lere öncülük etmeye devam edecek." dedi.
Jais, modelin çok daha uzun girdilere ekstrapolasyon yapmasını sağlayarak daha iyi içerik yönetimi ve doğruluk sağlayan ALiBi konum yerleştirmeleri de dahil olmak üzere birçok ileri teknoloji özelliği içeren, transformatör tabanlı bir geniş dil modelidir. Diğer son teknoloji teknikler arasında, modelin eğitim verimliliğini ve doğruluğunu artırmak için SwiGLU ve maksimum güncelleme parametrelendirmesi yer alır.
Jais'in eğitimi, ince ayarları ve değerlendirmesi Inception/MBZUAI ortak ekibi tarafından Condor Galaxy 1'de (CG-1) gerçekleştirildi. 13 milyar parametreli açık kaynak modeli, Arapça'nın karmaşıklığını, nüansını ve zenginliğini yakalamak için tasarlanmış 116 milyar Arapça jetondan oluşan benzersiz ve amaca yönelik oluşturulmuş bir veri kümesi üzerinde eğitildi. Ayrıca, diller arası aktarım yoluyla modelin performansını artırmak için 279 milyar İngilizce kelime belirtecini de içeriyordu. Inception ve MBZUAI, kullanıcı topluluğu büyüdükçe Jais'i genişletmeye ve iyileştirmeye devam edecek.
Cerebras Systems'in Kurucu Ortağı ve CEO'su Andrew Feldman, "G42 ile olan stratejik ortaklığımız halihazırda öncü sonuçlar sağlıyor. Birkaç hafta önce, ilk çoklu exaFLOP AI süper bilgisayarı Condor Galaxy 1'i (CG-1) tanıttık. Şimdi bu ortaklık açık kaynak topluluğu için lider Arapça Yüksek Lisansı ile başka bir önemli atılım daha gerçekleştiriyor. Cerebras'ta tutkumuz çığır açan bir teknoloji oluşturmaktır. En büyük ödüllerden biri, kullanıldığı yenilikçi yolları görmektir. Jais, uluslararası açık kaynak topluluğuna önemli bir katkıdır. Bu aynı zamanda CG-1'in kullanımının ne kadar kolay olduğunun ve son derece hızlı AI modeli geliştirmeyi mümkün kıldığının da bir kanıtıdır." dedi.
Çevirmen: Esmeralda Angun.