Yazılım devi Microsoft bugün yeni bir LLM (Büyük Dil Modeli) tanıttı. “Phi-4” adı verilen yeni model, ufak bir seçenek olarak karşımızda.
Phi ailesinin yeni üyesi Phi-4, Microsoft tarafından yapılan açıklamaya göre 14 milyar parametre ile görev yapıyor. Özellikle matematik problemi çözme konusunda çok yetenekli olduğu belirtilen yeni model, GPT-4o mini, Gemini 2.0 Flash ve Claude 3.5 Haiku karşısına konumlandırılıyor. Microsoft’un kısa süre önce kullanıma sunduğu Azure AI Foundry geliştirme platformunda yer alan yeni model, yüksek kaliteli sentetik veri kümelerinin yanı sıra insanlar tarafından oluşturulan verilerle eğitilmiş. Bundan önce Meta tarafından tanıtılan LLM Llama 3.3 70B ses getirmişti. Yeni model hakkında yapılan açıklamada şunlar aktarılmıştı: “Llama 3.3 70B, 405B modelimizin performansını sunuyor, ancak çalıştırması daha kolay ve uygun maliyetli en yeni modelimiz. Çevrimiçi optimizasyonlar da dahil olmak üzere, eğitim sonrası tekniklerdeki en son gelişmelerden yararlanan 70B, performansı düşük bir maliyetle önemli ölçüde artırarak tüm açık kaynak topluluğu için daha erişilebilir bir seçenek oluyor.”
Daha önce Llama modellerinin ulusal güvenlik alanında çalışan devlet kurumlarına ve şirketlere açılması ses getirmişti. Amazon Web Services, Oracle ve Microsoft’un yanı sıra, Palantir ve Lockheed Martin gibi savunma şirketlerinin de bulunduğu ABD hükümetiyle ulusal güvenlik alanında ortaklık yapan bir düzineden fazla özel sektör şirket ve devlet kurumu, artık Meta imzalı Llama yapay zeka modellerine rahatlıkla erişim sağlayabilecek. Bu adımın yapılan çalışmalara hız kazandıracağı ve çok sayıda alanda büyük fayda sağlayacağı belirtiliyor. Örneğin Oracle, uçak bakım belgelerini sentezlemek için Llama’yı kullanıyor. Böylelikle teknisyenler sorunları daha hızlı ve doğru bir şekilde teşhis ediyor, onarım süresini hızlandırıyor ve kritik uçakları tekrar hizmete alabiliyor.