Yapay zeka tarafının devi OpenAI ve internet devi Google, aktarıldığı kadarıyla LLM eğitimi için YouTube videolarını kullanmış.
OpenAI ve Google’ın yapay zeka modellerini ya da başka bir deyişle büyük dil modellerini (LLM) eğitmek için YouTube videolarının transkripsiyonlarını kullandığı belirtiliyor. The New York Times tarafından gündeme getirilen bu konu, söylendiği kadarıyla YouTube içerik üreticilerin telif haklarını ihlal ediyor, Google ise sürecin sadece eğitime onay verilen kişilerin içeriklerini kapsadığını belirtiyor. OpenAI bu konuda henüz bir açıklama yapmıyor, şirketin YouTube videoları ve podcast’ler ile en az iki farklı yapay zeka sistemini eğittiği belirtiyor. Bir milyon saatten fazla YouTube videosunu yazıya dökmek için Whisper konuşma tanıma aracını kullandığı söylenen OpenAI, bu konuda ciddi bir dava ile karşı karşıya kalabilir, bundan Google’ın da başı oldukça ağrıyabilir. Bu durum bir süredir gündemde çünkü OpenAI CTO’su Mira Murati’den kısa süre önce yöneltilen “Sora, YouTube videoları ile eğitildi mi?” sorusuna kaçamak bir cevap gelmişti. Eğer kaçırdıysanız Murati geçtiğimiz ay Joanna Stern tarafından sorulan, “Sora, YouTube videoları ile eğitildi mi?” sorusuna bir süre düşündükten sonra şaşırtıcı şekilde, “Ondan tam olarak emin değilim” cevabını vermişti.
İLGİNİZİ ÇEKEBİLİR
Sistemin eğitiminde herkese açık videoları ve aynı zamanda özel olarak lisansladıkları video setlerini kullandıklarını belirten Murati, yasal bir sorun yaşamamak adına direkt olarak kabul etmiyor, ilginç olarak da reddetmiyor ancak çok ama çok yüksek ihtimalle Sora’nın eğitiminde YouTube’daki milyonlarca videodan yardım alındı (Google bundan hiç hoşlanmayabilir ve önümüzdeki dönemde kanıt bulursa resmi bir dava açabilir).
Sistemin nefes kesen mevcut haline YouTube’daki videolardan destek alınmadan gelmesi çok mümkün görünmüyor, OpenAI genel olarak herkese açık içeriklerin LLM (Büyük Dil Modeli) eğitiminde ücretsiz şekilde kullanılabileceğini düşünüyor. Bu konuda geçtiğimiz gün ilk defa konuşan YouTube’un CEO Neal Mohan, OpenAI’ın Sora’yı eğitmek için platformun videolarını kullanıp kullanmadığını bilmiyor ancak böyle bir durumun platformun politikalarının açık bir ihlali olacağını belirtiyor.