Google Parti ve Imagen: “Yazıları tasarımlara dönüştüren sistemler”

23 Haziran 2022 17:31

ABD merkezli OpenAI tarafından geliştirilen yapay zekâ sistemi DALL-E 2 benzeri Google Imagen sonrasında Parti de gündemde.

Yapay zekâ sistemleri birçok şeyi değiştiriyor ve bunlar arasında artık sanat / tasarım alanları da yer alıyor. Milyonlarca farklı fotoğraf ile eğitilen bu sistemler, artık bir şeyler tasarlamayı çocuk oyuncağı haline getiriyor. Bunların son dönemde en çok ses getireni kesinlikle DALL-E 2 oldu. Bu teknoloji sayesinde yazılan basit cümleler ile gerçekçi tasarımlar / çizimler / fotoğraf oluşturabiliyor. Geçtiğimiz ay tanıtılan Google Imagen da tam olarak bunu sunuyor. Girilen cümlelerden etkileyici fotoğraflar / tasarımlar oluşturabilen sistem, DALL-E 2 ile benzer seviyede hatta birçok örnekte daha iyi sonuçlar sağlayabiliyor. Ancak ortaya çıktığı kadarıyla Google sadece bununla yetinmiyor. Süreçte bir de Parti üzerinde çalışmalar yapılıyor.

Imagen ile Parti için odak nokta aynı olmasına rağmen farklı temeller kullanılıyor. Google’ın açıklamasına göre Imagen tarafında “Diffusion” modeli kullanılıyor. Bu model rastgele noktalardan oluşan bir deseni görüntülere dönüştürmeyi öğrenebiliyor. Google burada “Bu görüntüler önce düşük çözünürlükte başlıyor ve daha sonra çözünürlük kademeli olarak artırılıyor.” diyor.

Parti’nin sürece olan yaklaşımı ise özel bir görsel koleksiyonunun, yapboz parçalarına benzer şekilde bir dizi kod girişine dönüştürülmesine dayanıyor. Süreçte girilen cümle / metin girdisi bu kod girişlerine çevriliyor ve yeni bir görüntü oluşturuluyor. Açıklamaya göre “otoregresif” mantığından çalışan Parti daha uzun cümlelerin altından kalkabiliyor ve daha gerçekçi sonuçlar ortaya koyabiliyor. Teknik temeli çok karmaşık olan, bu yüzden   aşırı da detay verilmeyen bu sistemler, herkesi çok etkiliyor ve büyük gelecek vadediyor.

DALL-E 2 gibi yazı ile yaratıcılık arasında bir bağ kuran etkileyici Google Imagen ve Parti sistemleri, henüz herkes tarafından kullanıma açık değil. Bunun arkasında kötüye kullanım ihtimali yer alıyor. DALL-E 2 gibi Google’ın da kendi sistemlerini herkese açmadan önce tehlikeli / sahte kullanım senaryolarından arındırmak istiyor.

Bu arada konuda ekran kartı devi Nvidia da çalışıyor. Firmanın benzer yapıda geliştirdiği GauGAN2 sisteminin tanıtım videosunu direkt olarak burada izleyebilirsiniz.

-Google tarafından gösterilen bu örnek, farklı yaklaşımların sonucu gösteriyor. Sayfanın en üstündeki görselde de farklı yaklaşımların sonucu anlaşılabiliyor.-

Google Parti ve Imagen yanında bu da ilginizi çekebilir: Renault tarafından hazırlanan uçan araç çalışması

Paylaş