Topaz Labs, videoları yenileyerek kalitesini artıran çok iyi bir yapay zeka modeli geliştirdi [Video]

07 Şubat 2025 16:02

Hazırladığı fotoğraf ve video yazılımlarıyla tanınan Topaz Labs, videoların kalitesini artıran çok iyi bir yapay zeka modeli geliştirdi.

Project Starlight adı verilen difüzyon modeli, doğrudan video restorasyonuna odaklanıyor ve şirkete göre alanda bir ilke imza atıyor. Çok düşük kaliteli videoları yenileyerek netleştiren ve çözünürlüğünü artıran model, gösterilen örneklere bakılırsa etkileyici bir performans ortaya koyuyor. Profesyonel kameralarla çekilen yeni görüntüleri de geliştirebilen model hakkında yaptığı açıklamada Topaz şunları aktarıyor: “Tamamen yeni bir model mimarisiyle oluşturulan difüzyon tabanlı yaklaşımımız, 6 milyardan fazla parametre kullanıyor ve en yeni Nvidia GPU’lardan yararlanıyor. Bu, şimdiye kadar oluşturduğumuz en dinamik ve geniş kapsamlı video iyileştirme yöntemi ve yapay zeka temelli video restorasyonu için yeni bir standart belirliyor.” Yakında erken erişime açılacak Project Starlight için paylaşılan tanıtım videosunu hemen aşağıda izleyebilirsiniz:

Bundan önce TikTok’un arkasındaki isim ByteDance tarafından geliştirilen OmniHuman-1 dikkat çekmişti. OmniHuman-1, aşağıdaki videolarda da görebileceğiniz üzere neredeyse ayırt edilemeyecek düzeyde gerçekçi içerikler üretebiliyor. Bu videoları üretebilmek için tek bir referans fotoğraf ve ses klibinin yeterli olduğu aktarılırken, yazılı komutlar ile oluşturulan videolar üzerinde belirli düzenlemelerin yapılabildiği de gösteriliyor. Gerçek videolar üzerinde değişiklik yapabildiği de (örneğin videodaki kişinin ağız hareketlerini değiştirebiliyor) belirtilen sistem, halen kusursuz çalışmıyor ancak şimdiden çok dikkatli bakılmadığı zaman ayırt edilemeyecek seviyede gerçekçi videolar üretebiliyor.

Bu alanda daha önce gündeme gelen Google Veo’nun yeni sürümü olmuştu. Google DeepMind tarafından geliştirilen Veo, geçtiğimiz aylarda herkese açılan OpenAI servisi Sora gibi yazılanlardan gerçekçi videolar oluşturabiliyor. Yeni sürüm Veo 2 ile 4096 x 2160 piksel çözünürlükte iki dakika videolar sunmayan başlayan DeepMind, çeşitli tarzlarda klipler oluşturabilen yeni modelin fizik hesaplamaları ve kamera kontrolleri konusunda daha iyi sonuçlar ortaya koyduğunu belirtiyor. İlk sürüme nazaran çok daha net görüntüler üretebilen Veo 2, şirkete göre daha iyi bir “sinematografi” anlayışına sahip. Bu sayede modele komut verirken belirli bir film türüne, sinematik efekte veya lense atıfta bulunabiliyor. Sistem bunları anlıyor ve üretilmek istenen videoyu ona göre hazırlıyor.

İnsan hareketlerinde de daha iyi olduğu söylenen Veo 2’nin yanında Imagen 3 modeli için de geliştirmeler yapıldı. Google’ın yazılanlardan görseller üreten yapay zeka sistemi artık daha aydınlık ve gerçekçi sonuçlar verebiliyor. Yapılan açıklamaya göre Veo 2, ABD’deki Google Labs kullanıcılarına kademeli olarak sunulacak. Test kullanıcıları başta 720p çözünürlükte sekiz saniyeye kadar görüntü üretebilecek. Imagen 3 ise şu anda ImageFX üzerinden 100’den fazla ülkedeki Google Labs kullanıcıları tarafından kullanılabiliyor.

Topaz Labs yanında bu da ilginizi çekebilir: Etkileyici görünen elektrikli motosiklet konsepti: Zero SR-X

Paylaş