Stable Diffusion üstüne kaliteyi oldukça artıran Stable Cascade geldi

15 Şubat 2024 11:37

Yazılanları görsel hale getiren sistemlerden Stable Diffusion üstüne kaliteyi oldukça artıran Stable Cascade getirildi.

Kısa süre önce Stability AI tarafından hazırlanan üretken yapay zeka sistemi Stable Diffusion XL Turbo gündeme gelmişti. Metin olarak yazdıklarınızı görsel hale getiren sistem, bunu daha siz yazarken anlık olarak yapabiliyor olmasıyla dikkat çekmişti. Normalde “yazıdan-görsele” sistemler hemen sonuç veremiyor, içeriğin oluşturulması için biraz beklenmesi gerekiyor. Bunu değiştiren yeni model aktarıldığı kadarıyla Stable Diffusion XL’dan farklı olarak 20 hatta 50 adım üzerinden değil tek bir adım üzerinden üretim yapıyor, işte tam olarak bu sayede gerçek zamanlı olarak çalışabiliyor. Bunun elbette olumsuz bir yanı oluyor, XL Turbo’nun sonuçları XL kadar büyük ve detaylı olmuyor. Şimdi ise Stable Cascade karşımızda yer alıyor. Stable Diffusion’dan daha kaliteli ve hızlı sonuçlar verebilen yeni sistem, gösterilen örneklere bakılırsa gerçekten çok “gerçekçi” sonuçlar ortaya koyabiliyor. Üretilen bir görsel için benzer yapıda farklı varyasyonlar da sunan sistem, şu an ticari kullanım haricindeki durumlar için GitHub üzerinden elde edilerek denenebiliyor. Stable Diffusion’dan farklı olarak tek bir büyük dil modeli değil Würstchen mimarisine dayanan üç farklı modeli temel alan Stable Cascade, tam olarak bu sayede performansı artırıyor çünkü üretimi farklı modeller üzerinden parçalara bölüyor.

Bu alanda bundan önce en çok ses getiren sistem DALL-E 3 olmuştu. “Yeni metinden görüntüye modelimiz DALL-E 3, ince detaylara sahip girdileri son derece ayrıntılı ve doğru görüntülere dönüştürebiliyor.” açıklaması yapılan, bir önceki sürüme oranla inanılmaz geliştirilen ve görseller üzerine net olarak okunabilen doğru yazılar yazabiliyor olmasıyla dikkat çeken yeni sistem hakkında ayrıca şunlar da paylaşılmıştı:

“DALL-E 3, karmaşık komutlara sadık görüntüler oluşturma konusunda DALL-E 2’den çok daha iyi çalışıyor. Örneğin DALL-E 3, belirli nesneleri ve aralarındaki ilişkileri içeren bir sahneyi doğru şekilde oluşturabiliyor. Sistem eller gibi insan detaylarında görsel oluştururken DALL-E 2’ye göre önemli gelişmeler getiriyor, üretimi genel olarak daha etkili hale getiriyor.” Yeni sistem ile üretilen çok sayıda seçenek direkt olarak buradaki paylaşımda ya da burada görülebiliyor.

Stable Cascade yanında bu da ilginizi çekebilir: Vivo X Flip katlanabilir telefon modeli

Paylaş