xAI adını verdiği bir yapay zeka şirketine sahip olan Elon Musk da LLM eğitimi için gerçek veri kalmadığını belirtiyor.
LLM yani ChatGPT gibi sistemlere güç veren büyük dil modelleri artık büyük oranda sentetik veriler kullanılarak eğitiliyor. Güçlü sunucu sistemlerinin yardımıyla elde edebilecekleri gerçek yani insan üretimi verinin hemen hepsine ulaşan yapay zeka firmaları, artık büyük dil modellerini eğitmek için sentetik veriler kullanıyor. Bu durum, yanlış içerikler üretme ve bir hayali bilgiler döngüsü yaratma konusunda ciddi riskler ortaya koyuyor ancak şirketlerin başka şansı bulunmuyor. “Gerçek verileri geçtiğimiz yıl içerisinde tükettik” diyen Elon Musk, verdiği bir röportaj kapsamında gelecek için, “Gerçek dünya verilerini desteklemenin tek yolu, yapay zeka tarafından oluşturulan sentetik veriler” açıklamasını yapıyor. Aktarıldığı kadarıyla Microsoft, Meta, OpenAI ve Anthropic gibi şirketler yapay zeka modellerini eğitmek için halihazırda sentetik veriler kullanıyor. Gartner, 2024 yılında yapay zeka ve analitik projeleri için kullanılan verilerin yüzde 60’ının sentetik olarak üretildiğini tahmin ediyor. Microsoft’un yakın zaman önce tanıttığı LLM’i Phi-4 de söylendiği kadarıyla gerçek dünya verilerinin yanı sıra sentetik veriler kullanılarak eğitilmiş.
İLGİNİZİ ÇEKEBİLİR
Yapay zeka alanında bundan önce OpenAI CEO’su Sam Altman’ın açıklaması gündeme gelmişti. Altman verdiği bir röportaj kapsamında, “Artık AGI’yi nasıl inşa edeceğimizi bildiğimizden eminiz.” dedi. Artificial General Intelligence (AGI) ya da Türkçe karşılığıyla Yapay Genel Zeka (YGZ), yapay zeka şirketlerinin şu anda en çok önem verdikleri konuların başında geliyor. YGZ, bir insanın yapabileceği herhangi bir zihinsel görevi başarıyla gerçekleştirebilecek makinenin zekası olarak özetleniyor ve bu açıdan büyük beklentilerin merkezinde yer alıyor.
Altman bundan önce bir ChatGPT Pro açıklaması ile dikkat çekmişti. OpenAI, geçtiğimiz aylarda 200 dolarlık ChatGPT Pro aboneliğini duyurmuştu. Plus ile sunulan tüm özellikler yanında güncel dil modellerine (LLM) ve diğer kilit sistemlere sınırsız erişim sunan ChatGPT Pro aboneliğinde, “o1” dil modeli daha fazla güce erişim sağlayabiliyor. Türkiye’de aylık 7.999 TL (web aboneliği 350 TL daha pahalı) fiyatı bulunan abonelik, OpenAI CEO’su Sam Altman’a göre şirkete para kaybettiriyor. Bunun nedeni, insanların bu aboneliği beklenenden daha yoğun şekilde kullanması. “Fiyatı ben seçtim ve biraz para kazanacağımızı düşündüm” diyen ancak bu amacına şu anda ulaşamamış gibi duran OpenAI, yakında “Pro” paketin fiyatını artırabilir ya da belirli limitler getirebilir.