DeepSeek, DALL-E 3’ü geçtiği iddia edilen görsel modeller yayınladı

28 Ocak 2025 09:57

Çinli üretken yapay zeka şirketi DeepSeek, bugün DALL-E 3’ü geçtiği iddia edilen yeni görsel modelleri yayınladı.

DeepSeek, Janus Pro serisi görüntü modellerini GitHub ve Hugging Face’te yayınladı. Şu aşamada bir ve yedi milyar parametreli iki farklı versiyonu bulunan Janus Pro’nun büyük olanı, şirketin iddiasına göre bazı testlerde Stable Diffusion ve DALL-E 3’ü geride bırakabiliyor. Hem görsel analizi hem de yazılanlardan görsel üretme konusunda yetenekli görünen modellerin, şu anda tam olarak hangi çözünürlükte çıktı verdiği bilinmiyor (bazı örnekler 768 x 768 piksel seviyesinde). Yedi milyar parametreli Janus Pro modeliyle gerçekçi fotoğraflar üretilebildiği gösterilirken, sistemin henüz mükemmel seviyede olmadığını belirtmek gerekiyor. Örneğin Android Authority tarafından yedi milyar parametreli Janus Pro modeliyle üretilen aşağıdaki görsel buna güzel bir örnek oluyor.

“Solda Janus Pro-7B, sağda DALL-E 3”

Çin merkezli yapay zeka şirketi DeepSeek, GPU konusunda bir ABD ambargosu altında olmalarına rağmen burada test edilebilen “R1” modelinin OpenAI’ın “01” modelinden daha iyi sonuç verdiğini belirtiyor. Şirkete göre R1, AIME, MATH-500 ve SWE-bench Verified kıyaslamalarında o1’i geride bırakıyor, birçok testte ise benzer performans ortaya koyuyor. 671 milyar parametreye sahip olan R1’in, 1,5 milyar parametre ile 70 milyar parametre arasında değişen özel versiyonları da bulunuyor.

En küçük modelin bir dizüstü bilgisayarda çalıştırılabildiği, R1’in tam kapasiteli versiyonunun ise hem eğitim hem de tam kapasiteli kullanımda OpenAI’dan çok daha “ucuz” olduğu ifade ediliyor. ChatGPT gibi çalışan “AI Asistan” isimli mobil uygulaması bugün App Store’un en popüler ücretsiz uygulaması (Türkiye ve birçok ülkede) olan DeepSeek, iddia edildiği kadarıyla ABD ambargosu bulunmasına rağmen 50 bin adet Nvidia H100’e sahip. Aynı zamanda H200’lere sahip olduğu da aktarılan şirket, aracı isimler aracılığıyla topladığı GPU’larla beklentileri aşan bir performans ortaya koyuyor.

DeepSeek gelişmeleri yanında bu da ilginizi çekebilir: Motorola’nın uzaktan kablosuz şarj teknolojisi

Paylaş