Üretken yapay zeka alanında öne çıkmayı başaran firmalardan olan Mistral, bugün “Large 2” isimli yeni büyük dil modelini duyurdu.
Rakiplerin güncel büyük dil modelleriyle mücadele edebilecek seviyede olduğu açıklanan Mistral imzalı Large 2, 123 milyar parametreli bir seçenek konumunda. Şirket model hakkında yaptığı resmi açıklamada, Large 2’nin eğitiminde odaklandığı en önemli konulardan birinin halüsinasyon sorunlarını en aza indirmek olduğunu söylüyor. Yani sırf cevap vermek için sonuç uydurmayan Large 2, aktarıldığı kadarıyla İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Arapça, Hintçe, Rusça, Çince, Japonca ve Korece‘nin yanı sıra 80 kodlama dilini anlayabiliyor. Large 2 şu anda Google Vertex AI, Amazon Bedrock, Azure AI Studio ve IBM watsonx.ai üzerinde kullanılabiliyor. Bundan önce ise Meta öne çıkmış ve şimdiye kadarki en büyük açık kaynak yapay zeka modeli Llama 3.1’i duyurmuştu. Açık kaynak olarak kullanıma sunulmaya başlanan büyük dil modeli Llama 3.1, şirketin iddiasına göre GPT-4o ve Anthropic’in Claude 3.5 Sonnet’inden belirli testlerde daha iyi performans gösteriyor.
Yeni LLM’in en üstte tam 405 milyar parametreye sahip olduğu (70 ve 8 milyarlık ufak versiyonlar da var) ve eğitim sürecinde 16 bin kadar Nvidia’nın H100 GPU’ların kullanıldığı aktarılıyor. Meta’nın önceki modellerinde olduğu gibi Llama 3.1 de kişisel kullanım için indirilebiliyor ya da AWS, Azure ve Google Cloud gibi bulut platformları üzerinden kullanılabiliyor. Llama 3.1 ile çok sayıda üretken yapay sisteme güç verecek şirket, bugün Meta AI sistemini Arjantin, Şili, Kolombiya, Ekvador, Meksika, Peru ve Kamerun gibi ülkelerde aktif etti ve Fransızca, Almanca, Hintçe, İtalyanca, Portekizce ve İspanyolca dil desteklerini getirdi.