Metinlerden görsel üretme alanında en güçlü isimlerden Midjourney, uzun bir aradan sonra yeni bir model duyurdu.
Yaklaşık bir yıl sonra yeni bir yapay zekâ görüntü modeli hazırlayan ve bugün aktif olarak test etmeye başlayan Midjourney, V7 modeli hakkında yaptığı paylaşımda, “Yeni V7 görüntü modelimizin alfa testi aşamasına başlıyoruz. Bu şimdiye kadarki en akıllı, yüksek kaliteli ve tutarlı modelimiz.” ifadelerini kullandı. Yeni model hakkında konuşan şirket CEO’su David Holz ise bu kez tamamen farklı bir mimari kullandıklarını belirtti. Holz, istemleri algılama konusunda çok daha akıllı olduğunu söylediği yeni model hakkında şu ifadeleri de kullandı: “Görüntü kalitesi, iyileştirilen doku kalitesiyle birlikte fark edilir derecede daha yüksek ve insan vücudu başta olmak üzere her türden nesne artık önemli ölçüde daha iyi bir tutarlılığa sahip.”
MidJourney v7 is out!
On my usual benchmark prompts, it only (kinda) gets one, though 😕 v6 was able to nail the pixel art, v7 regresses in this regard.
Prompts in alt, all were done on Fast w/o personalization pic.twitter.com/Qwme1Rt1Dc
— Xeophon (@TheXeophon) April 4, 2025
Şirket geçtiğimiz yılın yaz aylarında donanım işine giriş yaptığını duyurmuştu. Halen firmadan tam olarak ne tarz bir donanımın geleceği bilinmiyor. Midjourney’nin kurucusu David Holz, aktarıldığı kadarıyla donanım tarafına uzak bir isim değil. Daha önce Leap Motion’un CTO’su olan Holz, geçtiğimiz aylarda şirkete Ahmad Abbas’ı katmıştı. Abbas’ın Leap Motion’da görev aldığı ve aynı zamanda Apple bünyesinde beş yıl kalarak Vision Pro üzerinde çalışmalar yaptığı belirtiliyor.
İLGİNİZİ ÇEKEBİLİR
Alanda bu aralar daha çok OpenAI tarafından geliştirilen ChatGPT için kullanıma sunulan yeni görsel üretme sistem ses getiriyor. OpenAI’ın operasyon sorumlularından Brad Lightcap’e göre ChatGPT için sunulan yeni görüntü oluşturucu, duyurulduğu 25 Mayıs’tan bu yana 130 milyondan fazla kişi tarafından kullanıldı ve sistemle 700 milyondan fazla görüntü oluşturuldu. ChatGPT’nin yeni görsel altyapısı geçtiğimiz günlerde ücretsiz abonelere de açılmıştı. İlk aşamada ChatGPT Plus, Pro ve Team abonelerine açılan GPT‑4o temelli yeni sistem, doğrudan ChatGPT içerisinde yazarak görsel hazırlanmasına imkân tanıyor.
Yeni altyapıyla, uzun süredir kullanımda olan DALL·E’yi geride bırakan OpenAI, yeni geliştirilen modelin metin/yazı üretme konusunda çok başarılı olduğunu belirtiyor. Bu alanda birçok benzer sistemi geride bırakan ve gerçekten kullanılabilir kalitede yazılı görseller üretmeyi sonunda başaran şirket, sistemin yüklenen fotoğraflar üzerinden yeni içerikler üretebildiğini de aktarıyor. “4o Image Generation” adı verilen yeni sistem ile üretilen örneklere buradan göz atabilirsiniz. Bu altyapının Sora içerisinde de kullanılabileceğini belirtelim.