WhatsApp, Instagram ve Facebook’un çatı şirketi Meta, bu aralar büyük dil modeli “LLaMA 2” ile ses getiriyor.
Meta mühendisleri tarafından hazırlanan LLaMA 2, ChatGPT’nin arkasındaki “GPT” ya da Google Bard’ın arkasındaki “LaMDA” gibi bir büyük dil modeli. Birçok benzerinden farklı olarak açık kaynak tasarlanan yani üzerinde istenildiği gibi çalışılabilen “ücretsiz” sistem, aktarıldığı kadarıyla şu an üç farklı boyutta (7 milyar, 13 milyar ve 70 milyar parametre) geliyor. OpenAI’ın GPT-3.5 serisi 175 milyara kadar parametreye ve Google’ın LaMDA’sı ise 137 milyar parametreye sahip. Bu açıdan rakiplerinden çok daha geride yer alan ancak açık yapısıyla fark yaratan Meta imzalı LLaMA, herkes tarafından denenebiliyor ancak bunu yapmak kolay değil. Servisi denemenin en kolay yolu, burada yer alan ve Andreessen Horowitz tarafından hazırlanan “llama2.ai” internet sitesi. Bu sayfada yavaş çalışan sistem ile iletişime geçilebiliyor ve aşırı iyi olmasa da Türkçe dil desteği sunuluyor. Direkt olarak Meta CEO’su Mark Zuckerberg tarafından duyurulan LLaMA 2’nin Microsoft ile iş birliği içinde geliştirildiği açıklanıyor, bu sayede sistem Azure üstünde de rahatlıkla test edilebiliyor.
İLGİNİZİ ÇEKEBİLİR
Meta bundan önce ses odaklı bir yapay zeka ile ses getirmişti. Biliyorsunuz yapay zeka sistemleri her şeyi değiştiriyor, bunlar arasında ses ve müzik tarafı da yer alıyor. Bu alanda geçtiğimiz ay ses getiren Meta imzalı Voicebox olmuştu. Yazılanları müziğe dönüştüren MusicGen sonrasında karşımıza çıkarılan yeni sistem, direkt olarak Meta CEO’su Mark Zuckerberg tarafından tanıtıldı. Şirketin henüz herkese açmadığı bu sistem, yazılanları gerçek insan konuşmaları (Şimdilik altı farklı dilde) haline getirebiliyor. Yapılan açıklamaya göre sistem 50 bin saatten fazla ses kullanılarak eğitilmiş. Gösterilen ilk örneklerden çok iyi çalıştığı görülen sistem, yazılanları sesli hale getirmesi yanında içerisine yüklenen sesleri temizleyebiliyor. Burada ses kaydına giren köpek havlaması ya da otomobil kornası gibi istenmeyen gürültüler saniyeler içerisinde yapay zeka tarafından temizlenebiliyor.
Şimdilik geliştirme aşamasında olan sistem, ileride herkesin kullanımına açılabilir. Nasıl çalıştığı buradaki videoda net olarak gözler önüne serilen altyapı için “Gelecekte, Voicebox gibi çok amaçlı üretken yapay zeka modelleri sanal asistanlara ve Metaverse’deki NPC karakterlere doğal sesler verebilir.” açıklamasını yapan Meta, aynı zamanda şunları da aktarmıştı: “Voicebox, görme engelli kişilerin arkadaşlarından gelen yazılı mesajları yapay zeka tarafından kendi sesleriyle okunurken duymalarını sağlayabilir, içerik oluşturuculara videolar için kolayca ses parçaları oluşturmaları ve düzenlemeleri için yeni araçlar sunabilir ve çok daha fazlasını yapabilir.”