İnternet devi Google, bu sefer “VLOGGER” teknolojisiyle ses getirdi. Bu sistem fotoğrafları gerçek anlamda canlandırabiliyor.
Google araştırmacıları tarafından hazırlanan ve şimdilik bir araştırma projesi olarak karşımıza çıkarılan VLOGGER, yüklenen fotoğraflardaki kişileri algılıyor ve onları konuşma özelinde hareketli hale getirebiliyor. Bu sistem sayesinde kişiler sadece tek bir fotoğrafı kullanarak gerçekçi şekilde konuşan sanal versiyonlarını oluşturabiliyor ve video formatında çıktı alabiliyor. Şimdilik halen mükemmel olmayan sistem, girilen kayıt üzerinden kişilerin sesini de oluşturabiliyor. Biraz daha geliştirilmesi halinde büyük kapılar açabilecek güçte olan sistem, kötüye kullanım konusunda bazı endişeler uyandırıyor ancak bu konuda birçok önlem üzerinde çalışıldığı da aktarılıyor. İyi bir sonuç için özel bir yapay zeka model eğitimi gerektirmeyen sistem, aktarıldığı kadarıyla 800.000’den fazla farklı kişi ve 2.200 saatlik video içeren MENTOR adlı bir veri seti üzerinden geliştiriliyor. Oyunlardan içerik üretimine ve sanal gerçeklik tarafına kadar çok sayıda alanda kullanılabilecek sistem üzerinde çalışmaların devam edeceği bildiriliyor.
Google bundan önce yapay zeka temelli “SIMA” ile ses getirmişti. DeepMind ekibi tarafından hazırlanan SIMA (Scalable Instructable Multiworld Agent), şu aşamada bir yapay zeka araştırma çalışması ve oyun oynamayı gerçek oyunlar ile öğreniyor. DeepMind araştırmacılarının Hello Games (No Man’s Sky), Tuxedo Labs (Teardown) ve Coffee Stain (Valheim ve Goat Simulator 3) gibi stüdyo ve yayıncılarla birlikte çalışarak eğitti SIMA, adeta bizim gibi oyun oynayabilir seviyede ve sürekli olarak iyileştiriliyor. Bu sistemin tahmin edebileceğiniz üzere ortaya koyabileceği çok sayıda potansiyel bulunuyor ancak altyapının özellikle oyun dünyalarındaki NPC’leri tamamen değiştirme ihtimali bulunuyor.
Bu sistem sayesinde çok daha doğal şekilde hareket edebilen, çevresine bizim gibi tepki verebilen oyun karakterleri ortaya çıkabilir ve bu oyunlardaki NPC’leri önceden belirlenmiş rotaların dışına çıkararak gerçekçiliği inanılmaz artırabilir. Yapılan açıklamaya göre SIMA şu anda sağa / sola dönmek, merdivene tırmanmak ve harita kullanmak için menüyü açma gibi yaklaşık 600 temel beceriye sahip. İleride bir oyun içinde daha karmaşık işlevleri yerine getirmesi için talimat verilebileceği de söylenen sistem, gerçekten ilginç görünüyor ve önemli kapılar açacak izlenimi oluşturuyor.
Google oyun konusunda başka çalışmalar da yapıyor. Örneğin Google DeepMind ekibinin elinden kısa süre önce Genie isimli bir sistem çıktı. Bu sistem verilen komutlardan çok temel seviyede oynanabilir oyunlar üretebiliyor. Ses getiren Genie, yapılan açıklamaya göre 200 bin saatlik oyun videosu üzerinde eğitilmiş ve tek bir metin komutu veya görüntüden video oyunları oluşturabiliyor olmasıyla çok dikkat çekiyor.
Şimdilik herkese açılmayan ve gelecek için çok ciddi bir potansiyel ortaya koyan sistem, verilen bilgiye göre ana karakterin kim olduğunu belirleyebiliyor ve kullanıcının oluşturulan dünyada bu karakteri kontrol etmesini sağlayabiliyor. Bu gerçekten oldukça iddialı görünüyor, sistemin zamanla grafiksel açıdan çok daha iyi hale getirileceği düşünülüyor. OpenAI imzalı video modeli Sora’yı gördükten sonra bu tarz sistemlerin geleceği hakkındaki beklentiler inanılmaz artıyor, üretken yapay zeka sistemleri her geçen gün korkutucu derece iyi hale geliyor.