Cümleleri fotoğrafa dönüştüren teknolojiler ses getirmeye devam ediyor. Şu an bu konuda sunulan birden fazla teknoloji var.
Cümleleri fotoğrafa dönüştüren teknolojiler kategorisinin en bilindik olanı kesinlikle DALL-E. Geçtiğimiz aya kadar herkese açık olmayan DALL-E teknolojisi, şu an bekleme sırasına giren 1 milyon kişi tarafından beta formunda denebiliyor. Peki DALL-E tam olarak nedir? Temeli genel olarak oturtmak adına üzerinden geçersek bu teknoloji sayesinde yazılan basit cümleler ile gerçekçi tasarımlar / çizimler / fotoğraf oluşturabiliyor. Uzun zamandır üzerinden geliştirme yapılan ve son aşamada çok gerçekçi sonuçlar çıkarabilir hale gelen sistem, belirli fotoğraflar üzerine obje ekleyebilecek kapasiteye de sahip. Aynı zamanda süreçte sadece yazarak fotoğraf üzerinde düzenleme yapmak da mümkün olabiliyor. Sistem bir cümle için sadece bir fotoğraf sonucu vermekle de yetinmiyor. Kişilerin karşısına birçok farklı varyasyon getiriyor.
Yazı ile yaratıcılık arasında bir bağ kuran bu cümleleri fotoğrafa dönüştüren teknolojiler, bu aralar Fabian Stelzer tarafından gerçekleştirilen güzel bir karşılaştırma ile gündemde yer alıyor. Bu karşılaştırmalarda spesifik olarak DALL-E, Midjourney ve Stable Diffusion sistemleri kullanılıyor.
Her üç hizmeti de aynı cümleler üzerinden test eden Fabian Stelzer, sonuçları yukarıdaki galeride görebileceğiniz ilginç bir veri tabanı oluşturdu. Farklı yapay zekâ sistemlerinin cümlelere olan farklı bakış açısını açık şekilde gösteren karşılaştırma fotoğrafları, bu sistemlerin ne kadar gelişmiş olduğunu da bir kez daha kanıtlıyor.
Sanat ve tasarım dünyasını derinden etkilemesi beklenen bu sistemler, sürekli olarak geliştiriliyor ve henüz erken aşamada olmalarına rağmen büyük gelecek vadediyor. Kötüye kullanımlarını engellemek adına da çalışmalar yapılan bu ilginç teknolojik altyapı, makine öğrenme sistemleriyle her cümle sonrasında daha iyi hale geliyor.