TikTok’un arkasındaki isim ByteDance, OmniHuman-1 ile yapay zeka üretimi video alanında kaliteyi oldukça yükseltti.
ByteDance tarafından geliştirilen yeni yapay zeka sistemi OmniHuman-1, aşağıdaki videolarda da görebileceğiniz üzere neredeyse ayırt edilemeyecek düzeyde gerçekçi içerikler üretebiliyor. Bu videoları üretebilmek için tek bir referans fotoğraf ve ses klibinin yeterli olduğu aktarılırken, yazılı komutlar ile oluşturulan videolar üzerinde belirli düzenlemelerin yapılabildiği de gösteriliyor. Gerçek videolar üzerinde değişiklik yapabildiği de (örneğin videodaki kişinin ağız hareketlerini değiştirebiliyor) belirtilen sistem, halen kusursuz çalışmıyor ancak şimdiden çok dikkatli bakılmadığı zaman ayırt edilemeyecek seviyede gerçekçi videolar üretebiliyor.
Bu alanda en son gündeme gelen Google Veo’nun yeni sürümü olmuştu. Google DeepMind tarafından geliştirilen Veo, geçtiğimiz aylarda herkese açılan OpenAI servisi Sora gibi yazılanlardan gerçekçi videolar oluşturabiliyor. Yeni sürüm Veo 2 ile 4096 x 2160 piksel çözünürlükte iki dakika videolar sunmayan başlayan DeepMind, çeşitli tarzlarda klipler oluşturabilen yeni modelin fizik hesaplamaları ve kamera kontrolleri konusunda daha iyi sonuçlar ortaya koyduğunu belirtiyor. İlk sürüme nazaran çok daha net görüntüler üretebilen Veo 2, şirkete göre daha iyi bir “sinematografi” anlayışına sahip. Bu sayede modele komut verirken belirli bir film türüne, sinematik efekte veya lense atıfta bulunabiliyor. Sistem bunları anlıyor ve üretilmek istenen videoyu ona göre hazırlıyor.
İnsan hareketlerinde de daha iyi olduğu söylenen Veo 2’nin yanında Imagen 3 modeli için de geliştirmeler yapıldı. Google’ın yazılanlardan görseller üreten yapay zeka sistemi artık daha aydınlık ve gerçekçi sonuçlar verebiliyor. Yapılan açıklamaya göre Veo 2, ABD’deki Google Labs kullanıcılarına kademeli olarak sunulacak. Test kullanıcıları başta 720p çözünürlükte sekiz saniyeye kadar görüntü üretebilecek. Imagen 3 ise şu anda ImageFX üzerinden 100’den fazla ülkedeki Google Labs kullanıcıları tarafından kullanılabiliyor.