Ekran kartı devi Nvidia ve ChatGPT’yi geliştiren OpenAI şirketinin CEO’su Sam Altman, “DeepSeek” hakkında konuştu.
DeepSeek ve büyük ses getiren “R1” modeli hakkında OpenAI CEO’su Sam Altman, “DeepSeek’in R1’i, özellikle maliyetine oranla sunabildikleri açısından etkileyici bir model. İleride çok daha iyi modeller sunacağız. Yeni bir rakibe sahip olmak heyecan verici!” dedi. Altman ayrıca, “Misyonumuzda başarılı olmak için daha fazla bilgi işlem gücünün her zamankinden daha önemli olduğuna inanıyoruz. Hepinizi AGI (Yapay Genel Zeka) ve ötesine götürmek için sabırsızlanıyoruz.” açıklamasını yaptı. DeepSeek yüzünden piyasa değeri tam 600 milyar dolar azalan Nvidia tarafından yapılan açıklamada ise şunlara değinildi: “DeepSeek, yapay zeka alanında büyük bir ilerleme ve test süresi ölçeklendirmesinin mükemmel bir örneği. DeepSeek’in çalışmaları, bu teknik kullanılarak yeni modellerin nasıl oluşturulabileceğini, yaygın olarak bulunan modellerden nasıl yararlanılabileceğini ve bunların ihracat kontrolüne tamamen uygun sistemlerle nasıl yapılabileceğini gösteriyor.”
Çin merkezli yapay zeka şirketi DeepSeek, GPU konusunda bir ABD ambargosu altında olmalarına rağmen “R1” modelinin OpenAI’ın “01” modelinden daha iyi sonuç verdiğini belirtiyor. Şirkete göre R1, AIME, MATH-500 ve SWE-bench Verified kıyaslamalarında o1’i geride bırakıyor, birçok testte ise benzer performans ortaya koyuyor. 671 milyar parametreye sahip olan R1’in, 1,5 milyar parametre ile 70 milyar parametre arasında değişen özel versiyonları da bulunuyor. En küçük modelin bir dizüstü bilgisayarda çalıştırılabildiği, R1’in tam kapasiteli versiyonunun ise hem eğitim hem de tam kapasiteli kullanımda OpenAI’dan çok daha “ucuz” olduğu ifade ediliyor.
ChatGPT gibi çalışan “AI Asistan” isimli mobil uygulaması şu anda App Store’un en popüler ücretsiz uygulaması (Türkiye özelinde) olan DeepSeek, iddia edildiği kadarıyla ABD ambargosu bulunmasına rağmen 50 bin adet Nvidia H100’e sahip. Aynı zamanda H200’lere sahip olduğu da aktarılan şirket, aracı isimler aracılığıyla topladığı GPU’larla beklentileri aşan bir performans ortaya koyuyor.