404 Media tarafından yapılan haber ile ortaya çıktığı kadarıyla Nvidia da yapay zeka eğitiminde izinsiz videolar kullanmış.
404 Media’ya konuşan bir eski Nvidia çalışanı, şirketin mühendislerinden ürünlerine güç verecek bir yapay zeka modelinin (bu model henüz çıkmadı) eğitimi için Netflix, YouTube ve diğer kaynaklardan videolar indirilmesini istediğini söyledi. Görülen mesajlara göre çalışanlar Netflix de dahil olmak üzere çeşitli kaynaklardan tam uzunlukta videolar indirmeye çalışıyorlardı ancak özellikle YouTube videolarına odaklanmışlardı. 404 Media tarafından görüntülenen e-postalar, proje yöneticilerinin her gün inanılmaz sayıda videonun indirilebilmesi için Amazon Web Services merkezli 20 ila 30 arasında sanal makine kullanmayı tartıştıklarını dahi gösteriyor. Nvidia bu uygulamanın telif hakkı yasalarına uygun olduğunu savunuyor, ancak sürecin izinsiz olduğu aktarılıyor. Hatta çalışanların da bu durumun sorunlara neden olabileceğini sık sık dile getirdiği belirtiliyor. Yine 404media’nın araştırmasına göre Runway AI tarafından geliştirilen ve yazılanlardan video üretebilen OpenAI Sora rakibi yapay zeka sistemi de The New Yorker, VICE News, Pixar, Disney, Netflix ve Sony gibi şirketlerin içerikleri yanında, YouTube kanallarındaki popüler videolarla eğitilmiş. Bu içerikleri izinsiz olarak kullandığı aktarılan şirket, bu konuda gündeme gelen tek isim değil. Benzer bir konuda en son teknoloji devi Apple ses getirmişti.
İLGİNİZİ ÇEKEBİLİR
Geçtiğimiz ay yayınlanan bir haberde, Apple Intelligence altyapısının eğitimi için çok sayıda YouTube videosunun izinsiz olarak kullanıldığı aktarıldı. Hazırlanan haberde, WWDC24’te tanıtılan Apple Intelligence altyapısının temelindeki büyük dil modellerinin eğitiminde 170 binden fazla videodan yardım alındığı belirtildi. Bu süreçte Marques Brownlee (MKBHD), MrBeast, PewDiePie, Stephen Colbert, John Oliver ve Jimmy Kimmel gibi isimlerin videolarındaki altyazılar, EleutherAI adlı kar amacı gütmeyen bir kuruluş tarafından alınmış.
Bunun için de sürpriz olmayacağı üzere içerik üreticilerden izin alınmamış. Tepki çeken konuda bir açıklama yapan Marques Brownlee, “Apple, yapay zeka sistemleri için çeşitli şirketlerden veri temin etmiş. Bu şirketlerden birisi benimki de dahil olmak üzere YouTube videolarından tonlarca veri/transkript toplamış. Apple bu durumdan/sorundan teknik olarak kaçınıyor çünkü altyazıları toplayan o değil. Ancak bu kullanım uzun vadede ciddi bir sorun olacak.” demişti.
Bu konuda daha sonra resmi bir açıklama yapan Apple, YouTube videoları üzerinden eğitilen hiçbir modelin Apple Intelligence altyapısına güç vermediğini belirtti. Paylaşılan haberde YouTube videolarını OpenELM isimli bir modeli eğitmek için kullandığı söylenen Apple, yaptığı açıklama kapsamında OpenELM’in sadece araştırma amacıyla oluşturulduğunu ve modelin açık kaynak olarak herkese açık olduğunu aktardı. Yeni bir OpenELM sürümü geliştirmeyeceğini de belirten teknoloji devi, açıklaması kapsamında eğitim sürecinde YouTube videolarının kullanılmadığını ise söylemedi.