ElevenLabs, yazılanlardan ses efektleri üreten bir yapay zeka sistemi (Text to Sound Effects olarak isimlendiriliyor) hazırladı.
Günümüzde yazılı metinlerden görsel, video veya müzik üreten çok sayıda üretken yapay zeka sistemi bulunuyor. Bu sistemler arasına bugün ElevenLabs tarafından yazılı metinlerden ses efektleri üreten bir seçenek dahil edildi. Oluşturduğu içerikleri buradaki bağlantıda görebileceğiniz sistem, Shutterstock’tan gelen içerikler ile eğitilmiş ve gerçekten kullanılabilir çıktılar verebiliyor. Şu aşamada 22 saniyeye kadar ses efektleri üretebilen sistem, içeriklere insan sesi ile müzik de dahil edebiliyor. Buradaki bağlantıdan ücretsiz olarak kullanılabilen sistem, birçok içerik üreticinin olmazsa olmaz araçları arasına giriş yapabilir. Son dönemde sık sık yazılanlardan video üreten sistemler gündeme geliyor. Örneğin Google’ın çatı şirketi Alphabet ve Meta, yeni video odaklı yapay zeka sistemleri için Hollywood stüdyoları ile görüşmeler yapıyor. Alphabet ve Meta, OpenAI tarafından geliştirilen Sora rakibi sistemlere (Google Veo ve Meta Emu) sahipler ve bunları daha gelişmiş hale getirmek için Hollywood stüdyolarıyla içerik lisanslama görüşmeleri yapıyorlar.
Bu amaçla milyonlarca dolarlık bütçeler ayırdığı söylenen iki teknoloji devi, üretken yapay zeka temelli sistemlerini daha iyi sonuçlar sunar hale getirmek adına sürekli yeni video içerikleriyle eğitmek zorundalar. Bunu yasal sorunlar çıkmaması için resmi lisanslarla yapmak isteyen devler, burada hazırladıkları sistemleri Hollywood stüdyolarına pazarlama gibi bir amaç da güdüyorlar. Stüdyolar bu tarz sistemlere bir seviyeye kadar sıcak bakıyor çünkü yeni nesil yapay zeka sistemleri daha şimdiden, film/dizi yapım sürecinde maliyetleri azaltacak ve prodüksiyona hız katabilecek bir potansiyel ortaya koyuyor. Bu konuda OpenAI tarafı da adımlar atıyor, Sora’yı uzunca bir süredir büyük sinema şirketlerine gösteriyor.