Will Smith, viral olan “yapay zekâ” üretimi videosuyla dalga geçti

20 Şubat 2024 20:07

Geçtiğimiz yıl içinde üretken yapay zekâ tarafından hazırlanan bir Will Smith videosu inanılmaz ses getirmişti.

Teknoloji dünyasının en büyük gündem konusu yapay zekâ olmaya devam ediyor. Yeni nesil “üretken” yapıdaki sistemler hem teknik hem de görsel olarak yeni kapıları aralıyor, bunlar arasında video da yer alıyor. İşte bu konuda geçtiğimiz yıl en çok ses getiren içeriklerden birisi, Will Smith merkezli bir video olmuştu. Bu video çok ses getirmişti çünkü hem çok komik hem de ürkütücü bir tarafa sahipti. Bu aşağıda izleyebileceğiniz videoda Smith’in spagetti yemesi inanılmaz garip bir şekilde simüle ediliyordu ve video spesifik olarak “Chaindrop” adlı Reddit kullanıcısından geliyordu. O zaman 20 saniyelik bu video için birbirinden bağımsız olarak oluşturulmuş 10 adet iki saniyelik bölümün bir araya getirildiği söylenmişti. Her bir bölüm simüle edilmiş Will Smith’in açgözlülükle spagetti yemesini farklı açılarda gözler önüne seriyor, sürecin arkasında ise geliştirme aşamasında olan bir altyapı bulunuyordu. Videonun Alibaba’nın bir araştırma bölümü olan DAMO Vision Intelligence Lab tarafından hazırlanan ModelScope adlı yapay zekâ aracı üzerinde hazırlandığı aktarılmıştı.

ModelScope, “LAION5B, ImageNet ve Webvid” gibi veri tabanlarındaki milyonlarca fotoğraf ve binlerce videoyu analiz ederek, yazılan metinlerden videolar oluşturmak üzere eğitilmiş bir “text2video” modelini temel alıyordu. Bu sistem Shutterstock’tan gelen videoları dahi analiz ediyor, bu yüzden paylaşılan videoda Shutterstock’un koruma amaçlı logosu da görünüyordu. Bu videoyu şimdi gündeme getiren ise Will Smith tarafından çekilen aşağıda görebileceğiniz video oldu. Bu “gerçek” videoda viral olan yapay zeka üretimi içerikle dalga gelen Smith, kişileri bir kez daha güldürmeyi başardı.

OpenAI, biliyorsunuz geçtiğimiz günlerde yazılanları görsel hale getiren DALL-E sonrasında video üretimi tarafına da el attı. Firmanın yeni yapay zeka modeli “Sora”, yazılanlardan 60 saniyelik videolar üretebiliyor ve rakiplerine oranla çok ama çok daha iyi sonuçlar ortaya koyuyor. Bu alana biraz geç giriş yapan ancak çok iddialı bir altyapı hazırlayan firma, Sora’nın olası güvenlik risklerine karşı ilk aşamada belirli kişilere açılacağını belirtiyor. Sistemin kötüye kullanımını engellemek adına herkese açık genel çıkışı daha sonra yapacaklarını söyleyen firma, Sora’nın çok sayıda karaktere / insana / canlıya / objeye sahip kompleks sahneler üretebildiğini belirtiyor, gösterilen ilk örnekler de bunu doğruluyor. Kişilerin isteklerini fiziksel gerçeklik ile harmanlayan sistem, henüz mükemmel değil ve OpenAI da bunu kabul ederek bazı zayıf yanların olduğunu açık olarak belirtiyor. Elbette DALL-E gibi zaman içerisinde daha iyi hale getirilecek Sora, daha şimdiden çok büyük bir gelecek potansiyeli ortaya koyuyor.

Will Smith videosu yanında bu da ilginizi çekebilir: İnsansı robot Ameca ve yapabildikleri

Paylaş