Facebook, Instagram ve WhatsApp’ın başındaki firma Meta, yazılanları müziğe dönüştüren yapay zeka MusicGen ile ses getirdi.
Meta, birçok rakibi gibi gelecek için çok gelişmiş yapay zeka sistemleri geliştiren bir firma konumunda yer alıyor. Daha dün detaylarına burada yer verdiğimiz sohbet botu “Metamate” ile gündeme gelen şirket, bugün MusicGen ile karşımızda yer alıyor. MusicGen, yazılanları yani metin girdilerini müziğe dönüştürebiliyor. Bir örneğini hemen aşağıdaki Tweet içerisinde görebileceğiniz sistem, henüz geliştirme aşamasında yer alıyor. Girilen şarkıları analiz ederek üzerine metin girdilerine bakarak ekleme de yapabilen yapay zeka teknolojisi, “açık kaynak” temelinde hazırlanmış ve şu an direkt olarak burada ücretsiz olarak denenebiliyor. Müzik oluşturma süreci şimdilik biraz uzun süren ve yüksek kalitede maksimum 12 saniye uzunluğa çıkabildiği belirtilen sistem, aktarıldığı kadarıyla tam 20 bin saatlik müzik kullanılarak eğitilmiş. Yani aklınıza gelebilecek her türde müziği üretebilen MusicGen sistemi, tek parça bir şarkı oluşturmaktan çok küçük müzik bölümleri üretme ve ilham verme konusunda çok faydalı görünüyor. Oluşturulan müzik / ses parçalarının sistemlere indirilmesine izin veren sistem, genel girdiler yerine spesifik tanımlar kullanıldığı zaman daha iyi sonuçlar ortaya koyuyor.
We present MusicGen: A simple and controllable music generation model. MusicGen can be prompted by both text and melody.
We release code (MIT) and models (CC-BY NC) for open research, reproducibility, and for the music community: https://t.co/OkYjL4xDN7 pic.twitter.com/h1l4LGzYgf— Felix Kreuk (@FelixKreuk) June 9, 2023
İLGİNİZİ ÇEKEBİLİR
Peki Meta bu konuda bir ilke mi imza attı? Bunun cevabı hayır. Çünkü bu konuda daha önce de gösterimler yapıldı, benzer bir sistemin en son MusicLM özelinde internet devi Google karşımıza çıkardı. Yazılanları yani metinleri görsel haline getiren yapay zekâ sistemlerine benzeyen sistem, direkt olarak müzik üretimine odaklanıyor. Bu konuda bir ilke imza atmayan Google, kendi geliştirdiği MusicLM’in diğer örneklerden daha gelişmiş olduğunu belirtiyor. Aktarıldığı kadarıyla sistem 280 bin saatten fazla müzik ile eğitilmiş, bu sayede yazılanları istenilen hemen her türde bir tamamlanmış müzik haline getirebiliyor. Kompleks üretimler gerçekleştirebildiği aktarılan sistem, yapılan açıklamaya göre sadece türleri ve enstrümanları birleştirmekle kalmıyor, aynı zamanda normalde bilgisayarların kavraması zor olan soyut kavramları kullanarak parçalar da yazabiliyor. Mırıldanma, ıslık çalma veya bir resmin tarifine dayalı melodiler dahi oluşturabilen sistem, bir müzikte birden fazla türü harmanlayabiliyor ancak maalesef şu an herkes tarafından denenemiyor. Telif endişeleri (Eğitimde kullanılan 280 bin saatlik müzik arasında telif haklarıyla korunanlar var) nedeniyle Google’ın sistemi kendi içinde kullanmaya devam edeceği belirtiliyor, herkese açık bir kullanım için henüz bilgi verilmiyor.