Google, kısa süre önce üretken yapay zeka temelinde çalışan ve direkt olarak yazarak video üretim yapılabilen “Lumiere” sistemini duyurdu.
Hazırlanan tanıtım videosunu hemen aşağıda izleyebileceğiniz yeni sistem Google Lumiere, üretken yapay zeka temelinde hazırlanmış ve yazılanlardan beş saniyelik videolar oluşturabiliyor. Birçok benzerinden daha kaliteli videolar oluşturabilen sistem, şu an 1024×1024 piksellik çıktılar (Bu firma tarafından düşük çözünürlük olarak tanımlanıyor) veriyor ve sonucu istenilen tarzda özelleştirebiliyor. Bu konuda Google’ın paylaştığı çok sayıda örnek buradaki Github sayfasında yer alırken, üzerinde çalışmaların devam edeceği Lumiere’in son kullanıcıya ne zaman ya da nasıl ulaşacağı henüz bilinmiyor. Şirket Lumiere temelinde kullandığı “T2V” adı verilen metinden videoya modelini, metin başlıklarıyla birlikte tam 30 milyon video içeren bir veri seti kullanarak eğittiklerini belirtiyor.
Google bu konuda ilk defa bir adım atmıyor. Firma bundan önce video üretimi odağında tanıttığı “VideoPOET” ile ses getirmişti. VideoPoet, tekrar hatırlamak adına şirketin yeni LLM’i yani büyük dil modeli. Henüz geliştirme aşamasında olan bu sistem, girilen cümlelerden 10 saniyelik videolar oluşturabiliyor ve burada birçok benzer sistemden daha iyi performans ortaya koyuyor. Aşağıdaki videoda görebileceğiniz altyapı elbette henüz mükemmel seviyede değil ancak gelecek için şimdiden büyük bir potansiyel ortaya koyuyor. Sadece yazı değil girilen fotoğrafları / görselleri de verilen komuta bakarak hareketli hale getirebilen VideoPoet, yeni furya o olduğundan spesifik olarak dikey formatta içerikler üretmesi için tasarlanmış. Henüz OpenAI imzalı DALL-E gibi herkesin kullanılabileceği bir seçenek olmayan yapay zeka, Google araştırmacılarının verdiği bilgiye göre ileride metinden sese ve sesten videoya gibi alanlarda da görev yapacak.