Google yapay zeka temelli video üretimi odağında tanıttı: “VideoPOET” [Video]

21 Aralık 2023 15:25

İnternet devi Google, bu sefer video üretimi odağında tanıttığı “VideoPOET” ile ses getiriyor. Sistem dikkat çekici bir performans sunuyor.

Google VideoPoet, yapılan açıklamaya göre şirketin yeni LLM’i yani büyük dil modeli. Henüz geliştirme aşamasında olan bu sistem, girilen cümlelerden 10 saniyelik videolar oluşturabiliyor ve burada birçok benzer sistemden daha iyi performans ortaya koyuyor. Aşağıdaki videoda görebileceğiniz altyapı elbette henüz mükemmel seviyede değil ancak gelecek için şimdiden büyük bir potansiyel ortaya koyuyor. Sadece yazı değil girilen fotoğrafları / görselleri de verilen komuta bakarak hareketli hale getirebilen VideoPoet, yeni furya o olduğundan spesifik olarak dikey formatta içerikler üretmesi için tasarlanmış. Henüz OpenAI imzalı DALL-E gibi herkesin kullanılabileceği bir seçenek olmayan yapay zeka, Google araştırmacılarının verdiği bilgiye göre ileride metinden sese ve sesten videoya gibi alanlarda da görev yapacak.

Google, daha önce çıkan bilgilere göre Pixel serisi akıllı telefon modelleri için “Pixie” isimli bir yapay zeka temelli asistan da geliştiriyor. Üretken yapay zeka temelli, spesifik olarak da kısa süre önce tanıtılan Gemini temelli hazırlandığı söylenen Google Pixie, iddiaya göre önümüzdeki yıl gelecek Pixel 9 ve Pixel 9 Pro‘nun kalbinde yer alacak. Sesli iletişim kurulabilecek bu gelişmiş özellikler sunacak yapay zeka temelli asistan, mevcut gösterimlerin işaret ettiği kadarıyla çok yüksek bir bilgi alma ve verme performans ortaya koyacak.

Başta Pixel’lere özel bırakıldıktan sonra tüm Android telefonlara da getirilmesi beklenen Pixie, ilk aşamada Türkiye’den uzak kalacak. Bu üzücü ancak Google halen Pixel serisi akıllı telefon modellerini Türkiye’de resmi olarak satmayı tercih etmiyor. Tüm kilit detaylarına burada yer verdiğimiz yeni dil modeli Gemini hakkında Google Cloud tarafından dün yapılan basın açıklaması ise şöyle olmuştu:

“Geçtiğimiz hafta duyurduğu yapay zeka modeli Gemini ile dikkatleri üzerine çeken Google; Ultra, Pro ve Nano olmak üzere üç farklı seçeneği kullanıcılara sunuyor. Perşembe günü itibariyle kullanıma açılan Gemini Pro, araştırma kriterlerinde benzer modellere göre daha üstün performans sunuyor.

Gemini Nano da Pixel 8 Pro’dan başlayarak Android’de ve Gemini Pro’nun özel olarak ayarlanmış bir sürümü olan Bard’da yer alıyor. Gemini Pro’nun mevcut sürümü; işlev çağırma, yerleştirme, anlamsal erişim ve özel bilgi temeli gibi özellikler içeriyor. Ücretsiz kullanımın yanı sıra rekabetçi bir fiyatlandırmaya sahip olan model; dünya genelinde 180’den fazla ülke ve bölgede, 38 dili destekliyor.

32 binlik bir bağlam penceresiyle gelen ve ilerleyen dönemlerde bunun büyüyeceği vaadini veren model, ücretsiz olarak kullanılabiliyor. Gemini Pro, metni girdi olarak kabul edip çıktı olarak üretebilmesinin yanı sıra, metin ve görüntüleri bir araya getirerek çıktı üretebilen özel bir Gemini Pro Vision uç noktasını da içeriyor. Geliştiriciler için sunulan yazılım geliştirme kitleri aracılığıyla da Python, Android (Kotlin), Node.js, Swift ve JavaScript dilleri destekleniyor.”

Google çalışmaları yanında bu da ilginizi çekebilir: Hyundai’den otomatik çalışan şarj robotu

Paylaş