OpenAI, yapay zeka üretimi görüntüleri tespit etmek için yeni araçlar üzerinde çalışıyor

08 Mayıs 2024 09:04

ChatGPT’nin arkasındaki OpenAI, yapay zeka üretimi görüntüleri tespit etmek için yeni araçlar üzerinde çalışıyor.

Yapay zeka üretimi görüntüler ciddi sorun olabiliyor, bunların tespit edilmesi büyük önem arz ediyor. İşte bu konuda bir adım atan OpenAI, yeni sistemler geliştiriyor, şu an kendi servisi DALL-E 3 tarafından üretilen görselleri yüzde 98 doğrulukta tespit edebiliyor. Ancak söz konusu Midjourney gibi diğer servisler olduğu zaman firmanın mevcut algılama sistemi yeterince iyi çalışmıyor. İçeriğin diğer yapay zeka modellerinden olup olmadığını anlamadaki performansı düşük olan sistem, Midjourney gibi rakiplerden gelen görsellerin yalnızca yüzde 5 ila 10’unu “yapay zeka üretimi” olarak işaretleyebiliyor. Elbette bu konuda çalışmalara devam edecek firma, süreçte çalışan tek isim de değil. OpenAI, geçtiğimiz yıl içinde de üretken yapay zeka temelli görsel üretme sistemi DALL-E için bir filigran adımı atmıştı. O zaman sistem tarafından üretilen görsellerin sol üst köşesine bir filigran ekleyeceğin ve böylece görselin yapay zeka tarafından üretildiğini net olarak göstereceğini belirten firma, bu sayede YZ görselleri üzerinden sahte içeriklerin üretilmesini ya da yayılmasını önlemeyi hedefliyordu.

“Content Provenance and Authenticity (C2PA)” temelinde metadata işaretlemesi de yapmaya başlayacağını yani görselin normalde görünmeyen verileri arasına da yapay zeka tarafından üretildiğini ekleyeceği söyleyen firma, bunların yüzde 100 çözüm getirmeyeceğini kabul ediyor çünkü hem görsel işaretleme hem de metadata verileri silinebiliyor.

“Yeni metinden görüntüye modelimiz DALL-E 3, ince detaylara sahip girdileri son derece ayrıntılı ve doğru görüntülere dönüştürebiliyor.” açıklaması yapılan son sürüm, geçtiğimiz yıl içinde betadan çıkmış ve ChatGPT Plus ile ChatGPT Enterprise abonelerine açılmıştı. Bir önceki sürüme oranla inanılmaz geliştirilen ve görseller üzerine net olarak okunabilen doğru yazılar yazabiliyor olmasıyla dikkat çeken yeni sistem hakkında şunlar da aktarılıyordu:

“DALL-E 3, karmaşık komutlara sadık görüntüler oluşturma konusunda DALL-E 2’den çok daha iyi çalışıyor. Örneğin DALL-E 3, belirli nesneleri ve aralarındaki ilişkileri içeren bir sahneyi doğru şekilde oluşturabiliyor. Sistem eller gibi insan detaylarında görsel oluştururken DALL-E 2’ye göre önemli gelişmeler getiriyor, üretimi genel olarak daha etkili hale getiriyor.”

OpenAI haberleri yanında bu da ilginizi çekebilir: Hyundai’den otomatik çalışan şarj robotu

Paylaş