Slack, yapay zeka modellerini eğitmek için kullanıcı verilerini kullanıyor haberlerine cevap verdi

Can TUNÇER 20 Mayıs 2024 10:28

İş tarafında odaklanan en popüler servislerden olan Slack, yapay zeka modellerini eğitmek için kullanıcı verilerini kullanıyor haberlerine cevap verdi.

Milyonlarca kullanıcıya sahip olan Slack platformunun geçtiğimiz hafta içinde yapay zeka / makine öğrenimi modellerini kullanıcı mesajları, dosyaları ve diğer içerikler üzerinden açık izin almadan eğittiği iddia edildi. Herkese açık olmadığından Slack içerisinde çok özel ve gizli içerikler yer alıyor, bu açıdan ortaya atılan iddialar çok tepki topladı. Burada sürecin sona erdirilmesi için firmaya e-posta atılması gerektiği söylenmiş ve kullanıcılara bireysel olarak “benim paylaşımlarımı ya da mesajlarımı yapay zeka model eğitimde kullanma” seçeneğinin verilmediği de aktarılmıştı. Bu konu X üstünde patlayınca burada görebileceğiniz resmi bir paylaşımda bulunmak zorunda kalan şirket, “Slack’in geleneksel makine öğrenimi modelleri kimliksizleştirilmiş yapıdaki toplu verileri kullanıyor ve direkt mesajlardaki, özel kanallardaki veya genel kanallardaki mesaj içeriğine erişmiyor” dedi. “Bu modelleri müşteri verilerini yeniden üretebilecekleri şekilde oluşturmuyor veya eğitmiyoruz.” açıklamasını da geçen şirket, ek olarak şunları aktardı: “Slack’in kendi yapay zeka ürünü Slack AI, üçüncü parti LLM’lerden (Büyük Dil Modellerinden) yararlanıyor. LLM modellerini eğitmek için hiçbir müşteri verisi kullanılmıyor. Ayrıca müşteri verilerini kullanarak LLM’ler veya diğer üretken modeller geliştirmiyoruz.” Hepsine ek olarak, “Geleneksel makine öğrenimi modellerinde ve üretken yapay zekada verilerin nasıl kullanıldığını açıklama konusunda daha iyi bir iş çıkarabilirdik.” diyen Slack, bu konuda halen birçok kişiyi tam olarak tatmin etmiş değil.

İLGİNİZİ ÇEKEBİLİR

Temizlikte zirveye çıkan robot süpürge; Ezviz RS20 Pro

Geçtiğimiz aylarda ekran kartı pazarının en büyük ismi olan Nvidia, üç yazar tarafından izinsiz yapay zeka eğitimi üzerinden dava edilmişti. Reuters’a göre Nvidia’yı dava eden yazarlar Brian Keene, Abdi Nazemian ve Steward O’Nan. Bu üç isim yazdıkları eserlerinin, NeMo yapay zeka platformundaki LLM yani büyük dil modelinin eğitimi için kullanılan ve yaklaşık 196.640 kitaptan oluşan bir veri setinin parçası olduğunu belirtiyor. Aktarıldığı kadarıyla ekim ayında telif hakkı ihlali nedeniyle Nvidia tarafından kapatılan NeMo, bahsi geçen veri setiyle tam üç yıl boyunca eğitilmiş ve bunun için çoğu yazardan tam olarak izin alınmamış.

Bu konuda Nvidia’dan bir açıklama gelmiyor ancak firmanın dava sonucunda ciddi bir ceza ödeyebileceği düşünülüyor. Bu tarz davalar elbette ilk defa açılmıyor. Örneğin geçtiğimiz aylarda The Intercept, Raw Story ve AlterNet, OpenAI ve Microsoft‘a ayrı ayrı davalar açtı.

Bu davaların arkasında, ChatGPT’nin temelinde yer alan GPT’lerin eğitiminde kullanılan içeriklerin izinsiz olarak alınması ve neredeyse kelimesi kelimesine veya bazen kelimesi kelimesine kopyalanarak düzgün şekilde kaynak belirtilmeden kullanılması yer alıyor. Davacılar OpenAI ve Microsoft’un potansiyel telif hakkı ihlallerinin farkında olduğunu söylüyor, buna kanıt olarak OpenAI’ın web sitesi sahiplerinin içeriklerinin GPT eğitimi için alınmasını engelleyecek bir altyapı hazırlaması gösteriliyor.

OpenAI ve Microsoft bu konuda daha önce de hedef alındı. Yazarlar Nicholas Basbanes ve Nicholas Gage OpenAI ile Microsoft’a, LLM’lerin yani büyük dil modellerinin eğitimine yardımcı olmak adına (GPT) telif hakkıyla korunan eserlerinin çalınması nedeniyle dava açmıştı. Bu konuda ilk olmayan yazarlar, iki şirketten hırsızlık iddiası üzerinden tazminat almaya çalışacaklar.

Hepsinden önce iki isme The New York Times dava açacağını duyurdu, bu dava kapsamında ünlü yayın kuruluşu OpenAI’ın ChatGPT ve Microsoft Copilot’a güç veren büyük dil modellerini (GPT) eğitmek için milyonlarca makalesini izinsiz olarak kopyaladığını iddia etti. Times bu dava kapsamında her iki şirketin de milyarlarca dolarlık tazminattan sorumlu tutulmalarını istedi.