Google DeepMind’ın Yeni Suni Zekâsı Soundtrack Oluşturacak

Google DeepMind’ın yeni suni zekâ aracı, hem suni zekâ üretimi hem geleneksel videolara müzik meydana getirecek.
Google’ın DeepMind suni zekâ laboratuvarı, son dönemde popüler olan video oluşturan suni zekâların en büyük eksiklerinden olan arka plan müziği ve hatta diyalog oluşturma sorununu çözmeye hazırlanıyor. V2A (video ötesi ses) teknolojisi adını verdiği teknoloji üstündeki ilerlemelerini paylaşan laboratuvar, Google Veo ve OpenAI Sora benzer biçimde video oluşturma araçlarıyla da eşleştirilebiliyor.
DeepMind ekibi tarafınca paylaşılan blog yazısına nazaran sistem ham pikselleri anlayabiliyor. ve bu bilgiyi de metin istemleriyle birleştirebildiğini açıkladı. Bu eşleşme üstünden de ses efektleri oluşturuluyor. Bu vasıta ek olarak sessiz filmler ya da sesi olmayan öteki videolar için de kullanılabiliyor.
DeepMind ekibi araçlarına güveniyor
Aslına bakarsak ses oluşturmak için kullanılabilecek ilk suni zekâ DeepMind’ın geliştirdiği teknoloji değil ve son da olmayacak. ElevenLabs da daha ilkin bu tür bir vasıta piyasaya sürmüştü. Öte taraftan DeepMind ekibi, kendi araçları için “hem pikselleri anlayabilmesi hem metin istemi eklemenin isteğe bağlı olması sebebiyle mevcut video ötesi ses çözümlerinden değişik” ifadesini kullanıyor.
DeepMind araştırmacıları bu teknolojiyi geliştirmek için yaptıkları çalışmalarda suni zekâ tarafınca üretilmiş, videolar, sesler, detaylı ses açıklamaları ve transkriptlerden oluşan verilerle eğitti. Araştırmacılar ek olarak V2A teknolojisinin, kaynak videoda bozulmalar olduğunda çıktının ses kalitesinde düşüş yaşanması benzer biçimde mevcut problemler üstünde de çalıştıklarını belirtiyorlar. DeepMind ekibi, teknolojiyi her insana açık hâle getirmeden ilkin de “titiz güvenlik değerlendirmeleri ve testlerden geçireceklerini” de taahhüt etti.


