İnternet devi Google, bünyesinde bir çok teknoloji geliştiriyor. Çoğu deneysel bu projelerden gerçekten inanılmaz sonuçlar ortaya çıkabiliyor. İşte bu konuda gerçekten dikkat çeken bir çalışma daha karşımızda bulunuyor.
Google Research Blog‘da yayımlanan yeni deneysel teknoloji, nöral ağ ve derin öğrenme sistemleri üzerine kuruluyor. Şirketin bu yeni teknolojisiyle sesleri birbirinden daha önce hiç görmediğimiz kadar iyi şekilde ayırabiliyor. Şirket burada “kokteyl parti etkisinden” bahsediyor. Bu kavram, birçok insanın aynı anda konuştuğu gürültülü / kalabalık bir ortamda kişinin karşısındakinin anlattıklarını anlayabilmesi olarak geçiyor. Bunu herkes gündelik hayatında yaşıyor. Çok gürültülü bir ortamda dahi dikkatinizi sadece bir kişiye verebiliyor buna rağmen kendinizi çevreye tamamen kapatmıyorsunuz. Yani siz karşınızdaki dinlerken dahi adınız geçerse bunu fark edebiliyorsunuz. İşte insanların bu konuda çok iyi olduğu belirtilen şirket, süreci makinelere de getirmek istiyor. Bunun için hazırlanan sistem de gerçekten çok iyi çalışıyor. Geliştirilen bu devrimsel altyapı ses ile görsel kaynağı bir araya getirebiliyor. Bu sayede örneğin tek bir görüntü içerisinde konuşan iki kişiden istenildiği zaman sadece bir tanesi duyulabiliyor.
Geliştirilen bu yeni ses ayrıştırma altyapısı, sadece bilimsel değil günlük kullanıma da uygulanabiliyor. Örneğin bu teknolojiyle kalabalık bir ortamdaki video görüşmeler “işitsel” anlamda çok daha iyi hale gelebiliyor. Üzerinde çalışmalar devam eden ve yeni verilerle eğitilmeye devam eden ses tabanlı nöral ağ, oldukça devrimsel duruyor.