Google I/O 2024 etkinliğinde yapılan tüm büyük duyuruları bir araya getirdik. Yapay zekanın merkezde olduğu etkinlikte önemli yenilikler gösterildi.
Google I/O 2024 etkinliğinde internet devi Google’ın yakın gelecekte kullanıma sunacağı birbirinden ilginç yeni teknolojilerini görme şansı elde ettik. Sürpriz olmayacağı üzere neredeyse tamamen yapay zeka odaklı etkinlikte dikkat çekici çok sayıda gelecek gösterimi yapıldı. Gemini dil modelleri ile yapay zeka tarafında şimdiden çok güçlü olan ancak bugün OpenAI karşısında daha da sağlam bir şekilde duracağını gözler önüne seren şirket, ufak da olsa Android 15’e de değinilen geliştirici konferansında beklendiği gibi donanımı geri planda tuttu. Peki bugün Google’dan tam olarak neler geldi? Maddeler halinde Google I/O 2024’ün öne çıkanları şöyle:
-Etkinlik Google’ın üretken yapay zeka temelli müzik oluşturma aracı MusicFX DJ’i merkeze alan garip bir şov ile başladı. Bu şovu direkt olarak Marc Rebillet üstlendi.
Starting today, AI Overviews will begin rolling out to everyone in the U.S, with more countries coming soon. #GoogleIO pic.twitter.com/KlMmmEKqI2
— Google (@Google) May 14, 2024
-Üretken yapay zeka temelli “Search Generative Experiences” altyapısı artık “AI Overviews” olarak geçecek. Bu hafta ABD’de herkese açılacak sistem, daha sonra diğer ülkelere götürülecek. Tek seferde sorulan çok sayıda soruyu dahi algılayan ve sizin yerinize araştırarak cevaplar verebilen AI Overviews, bu altyapıda internet sitelerinin bilgilerini alarak onları geri plana itiyor, cevaplar direkt olarak Google arama sayfasında çıkıyor. Bu sistem çekilen fotoğraflar üzerinden görsel arama yapabiliyor, eğer video çekilirse videoyu karelerine bölerek yaşadığınız bir sorunun çözümü hakkında detaylı arama gerçekleştirebiliyor.
Ask Photos, a new feature coming to @GooglePhotos, makes it easier to search across your photos and videos with the help of Gemini models. It goes beyond simple search to understand context and answer more complex questions. #GoogleIO pic.twitter.com/OsYXZLo5S1
— Google (@Google) May 14, 2024
-Google Fotoğraflar içerisinde üretken yapay zeka temelli bir arama sistemi geliyor, “Ask Photos” isimli bu sistem sorulan soruları algılayarak fotoğraf bulabiliyor ya da isteğinize uygun olarak albümler oluşturabiliyor.
-Gemini 1.5 Pro artık küresel olarak tüm geliştiricilere açılıyor, aynı zamanda Workspace Labs özelinde de çıkış yapılıyor.
İLGİNİZİ ÇEKEBİLİR
-Gemini dil modeli NotebookLM (İlk kez geçtiğimiz yıl duyurulmuştu) özelinde artık yazılı olarak verilen verilerden/bilgilerden, istediğiniz konuda konuşabilen özel bir sesli asistan oluşturabiliyor. Bu asistanla konuşarak iletişim kurulabiliyor, sistem oldukça doğal görünüyor.
-Google, “AI Agents” isimli yapay zeka yardımcılarıyla kişilerin hayatını kolaylaştıracak. AI Agents’lar birden fazla Google servisine erişim sağlayarak bilgi toplayabilecek.
Today, we’re excited to introduce a new Gemini model: 1.5 Flash. ⚡
It’s a lighter weight model compared to 1.5 Pro and optimized for tasks where low latency and cost matter – like chat applications, extracting data from long documents and more. #GoogleIO pic.twitter.com/WP26QVUHC7
— Google DeepMind (@GoogleDeepMind) May 14, 2024
-Yeni Gemini 1.5 Flash büyük dil modeli tanıtıldı. Daha hızlı ve verimli olduğu söylenen bu model, 1.5 Pro’dan daha az kapsama/kapasiteye sahip.
We’re sharing Project Astra: our new project focused on building a future AI assistant that can be truly helpful in everyday life. 🤝
Watch it in action, with two parts – each was captured in a single take, in real time. ↓ #GoogleIO pic.twitter.com/x40OOVODdv
— Google DeepMind (@GoogleDeepMind) May 14, 2024
-Project Astra duyuruldu. Bir üretken yapay zeka temelli dijital asistan olan Astra, telefon kamerası üzerinden çevreyi görerek hemen her şeyi algılıyor ve ne oldukları hakkında açıklama yapabiliyor. Sorulan sorulara çok akıcı şekilde cevap verebilen sistem, telefon ekranı ya da bir tabloya çizilen işaretçileri dahi algılıyor ve ona göre cevaplar verebiliyor.
We’re introducing Imagen 3: our highest quality text-to-image generation model yet. 🎨
It produces visuals with incredible detail, realistic lighting and fewer distracting artifacts.
From quick sketches to very high-res imagery, here’s a look at what it can create. 👀 #GoogleIO pic.twitter.com/XMrQYGeSiO
— Google DeepMind (@GoogleDeepMind) May 14, 2024
-Imagen 3 görsel yapay zeka modeli duyuruldu. Yazılanlardan görseller üreten sistem, yapılan çalışmalar sonrasında oldukça gerçekçi sonuçlar sunabiliyor.
Together with @YouTube, we’ve been building Music AI Sandbox, a suite of AI tools to transform how music can be created. 🎵
To help us design and test them, we’ve been working closely with musicians, songwriters and producers. ↓ #GoogleIO pic.twitter.com/pMLa3aCveu
— Google DeepMind (@GoogleDeepMind) May 14, 2024
-Music AI Sandbox üzerinden müzisyenlere yeni şarkılar/müzikler üretebilecekleri, mevcut müzikleri saniyeler içerisinde başka tarzlara dönüştürebilecekleri yeni yapay zeka araçları sunuluyor. Sanatçılar sadece yazarak yani isteklerini yazılı olarak belirterek müzikler oluşturabiliyor.
🎥Introducing Veo, our new generative video model from @GoogleDeepMind.
With just a text, image or video prompt, you can create and edit HQ videos over 60 seconds in different visual styles. Join the waitlist in Labs to try it out in our new experimental tool, VideoFX #GoogleIO pic.twitter.com/RnMsWu9s1q
— Google (@Google) May 14, 2024
-OpenAI Sora rakibi “Veo” duyuruldu. 1080P çıktılar veren sistem, Sora gibi yazılanlardan videolar oluşturabiliyor. 1 dakika üstü videolar alınabilen sistem, Google’ın gösterdiği örneklere göre gerçekçi sonuçlar ortaya koyuyor.
-Bulut tarafına özel yüksek performanslı yeni TPU (Tensor Processing Units) Google Trilium ve ARM temelli buluta özel Axiom işlemci duyuruldu.
The side panel in @GoogleWorkspace now uses the Gemini 1.5 Pro model. With a longer context window and more advanced reasoning, Gemini in Workspace can now answer a wider variety of questions and provide more insightful responses. #GoogleIO pic.twitter.com/Sx6i94Hpt2
— Google (@Google) May 14, 2024
-Popüler e-posta servisi Gmail, Gemini’dan yardım alarak e-posta’ları özetleyebiliyor. Bu özetler üzerinden yapay zekaya sorular sorulabiliyor, otomatik olarak oluşturulan cevaplar alınabiliyor ve böylelikle ciddi zaman kazanılabiliyor. Gemini aynı zamanda kullanıcıların Gmail’ini daha düzenli hale getirebiliyor, örneğin gelen faturaları düzenleyebiliyor ya da rakamsal verileri bir araya getirerek, “Bu projedeki en büyük harcama nereye oldu?” gibi sorulara tablo hazırlayarak görse cevaplar verebiliyor:
-Gemini’ı merkeze alan bir sanal iş arkadaşı duyuruldu. Yapay zeka temelli iş arkadaşı, ortak projelerde yardımcı olması için tasarlanmış ve sorulan sorulara hızlıca cevap verebiliyor. Ortak grupların tüm verileri ile konuşmalarına erişim sağlayan ve topladıklarından özetleme yapabilen sistem, örneğin herkesin boş olduğu bir saate otomatik olarak yemek ayarlayabiliyor.
-Mobil odaklı Gemini Live sayesinde Gemini dil modeliyle doğal bir şekilde sesli iletişim kurulabilecek. Burada bir “Gems” altyapısı da sunulacak, burada isteğe bağlı özel sesli asistanlar oluşturulabilecek.
This summer, we're adding new trip planning capabilities to Gemini Advanced. With advanced reasoning that considers space-time logistics, Gemini will be able to create a personalized itinerary, saving you hours of work. #GoogleIO pic.twitter.com/qH6GRccWZd
— Google (@Google) May 14, 2024
-Gemini, seyahat planlama konusunda da kişilere yardımcı olacak. Bu altyapı Gemini Advanced (Ücretli) içinde olacak ve seyahatleri birden fazla kategoride (Otel, yolculuk vb.) planlayabilecek.
-Artık Android’in temeline de Gemini konuluyor, yapay zeka temelli arama sistemleri Android 15’in standardı oluyor. İlk defa Samsung Galaxy S24 ailesiyle sunulan Circle to Search sistemi, Google I/O 2024 kapsamında aktarıldığı kadarıyla yakında matematik problemleri gibi daha kompleks aramalarda da kullanılabilecek.
Gemini on @Android is becoming more helpful and context aware. Later this year, you’ll be able to drag-and-drop generated images into Google Messages & Gmail, and ask questions about @YouTube videos and PDFs right on your device. #GoogleIO pic.twitter.com/ZRajfzXBWw
— Google (@Google) May 14, 2024
-Android’in merkezindeki Gemini, YouTube videolarından aradığınız cevapları bularak çıkarabiliyor. Bu bazı durumlarda büyük zaman kazandıracak özellik aynı zamanda PDF dosyalarında da çalışıyor.
-Google’ın belirli Pixel telefonlarına yıl sonunda ses, metin ve görsel algılama özellikli, büyük oranda direkt olarak cihazda çalışacak Gemini Nano modeli gelecek.
Thanks to Gemini Nano, @Android will warn you in the middle of a call as soon as it detects suspicious activity, like being asked for your social security number and bank info. Stay tuned for more news in the coming months. #GoogleIO pic.twitter.com/wtc3rrk0Gc
— Google (@Google) May 14, 2024
-Bazı Android 15 cihazlarda Gemini Nano kullanıcıları dolandırıcılara karşı koruyacak, örneğin gelen telefon görüşmelerini analiz ederek “Arayan bu kişi büyük ihtimalle dolandırıcı dikkatli ol” diyebilecek.
-Gemini temelli “açık kaynak” büyük dil modeli Gemma da etkinlikte yer aldı. Spesifik olarak “PaliGemma” duyuruldu, bu modelin direkt olarak görsel odaklı olduğu söylendi. Aynı zamanda haziran ayında 27 milyar parametreli Gemma 2.0’ın geleceği de duyuruldu.
-Google yapay zeka tarafından üretilen görsel içeriklerde, SynthID temelli bir özel filigran kullanacak. Bu sayede içeriğin yapay zeka tarafından üretildiği kolaylıkla anlaşılabilecek.
-LearnLM duyuruldu. LearnLM bünyesinde Gemini’dan gelen ancak spesifik olarak eğitim/öğretim tarafına odaklanan dil modelleri barındıracak. Bu temelde YouTube’daki eğitim videolarına soru sorulabilecek bir bölüm eklenecek, kişiler burada videodaki konular hakkında sorular bulabilecek.
-Etkinlikte “AI (Yapay Zeka)” kelimesinin 120 kez geçtiği açıklandı.
-Etkinlik tam iki saatlik sunum sonrasında sona erdi.