Nvidia, resmi bir blog yazısı yayınladı ve “RTX 50 Serisi GPU’lar DeepSeek R1 için en hızlı seçenek” açıklamasını yaptı.
Bu konuda, “Kısa süre önce piyasaya sürülen DeepSeek R1 model ailesi, yapay zeka dünyasında yeni bir heyecan yarattı. GeForce RTX 50 Serisi GPU’lar, saniyede 3.352 trilyon işleme kadar yapay zeka gücüyle DeepSeek model ailesini PC pazarındaki diğer tüm çözümlerden daha hızlı çalıştırabiliyor” açıklamasını yapan Nvidia, DeepSeek R1’in düşük eğitim maliyeti ortaya çıkınca 600 milyar dolarlık devasa bir borsa kaybı yaşamıştı. Uzun süredir sistemlerde yerel olarak LLM çalıştırmaya yönelik kullanışlı bir uygulama sunan şirket, son paylaşımında dünya genelinde 100 milyondan fazla RTX ekran kartlı PC’nin olduğunu söyledi ve R1 özelinde hemen aşağıda görebileceğiniz Radeon 7900 XTX tablosunu paylaştı:
DeepSeek için bundan önce Microsoft bir adım atmıştı. Microsoft’un Azure AI Foundry platformunda şu anda GPT-4, Mistral AI ve Meta-Llama 3 yanında Çin’de geliştirilen DeepSeek R1 modeli de yer alıyor. Bu ilginç bir gelişme oldu çünkü Bloomberg’in haberine göre OpenAI ve Microsoft şu anda DeepSeek’in kendi modellerini eğitmek için OpenAI’ın sağladığı API’ı kullanıp kullanmadığını araştırıyor. Konu hakkında bilgi sahibi olan kaynaklar, Microsoft güvenlik araştırmacılarının 2024’ün sonlarında Çinli girişimle bağlantılı olduğuna inanılan büyük miktarda OpenAI verisinin sızdırıldığını tespit ettiklerini söylüyor. Bu arada Microsoft bir DeepSeek adımı daha planlıyor.
Resmi açıklamaya göre yakında 1.5 milyar parametreli “DeepSeek-R1-Distill-Qwen-1.5B” modeli Copilot+ PC’ler için sunulacak. Daha sonra 7 ve 14 milyar parametreli versiyonları da gelecek model, ilk aşamada Snapdragon X işlemcili Copilot+ PC’lerde kullanılabilecek. Sürece daha sonra Intel Lunar Lake ve AMD Ryzen AI 9 işlemcili modeller de dahil edilecek. Bu konuda bir açıklama yapan şirket, “Bu optimize edilmiş modeller, geliştiricilerin Copilot+ PC’lerdeki güçlü NPU’lardan yararlanarak cihazlarında yerel olarak verimli şekilde çalışan yapay zeka destekli uygulamalar oluşturmasına olanak tanıyacak.” dedi.