Google, Suni Zeka ile Üretilen Videoları Suni Zeka ile Seslendirecek

Google’ın suni zeka birimi DeepMind, suni zeka tarafınca üretilen videoları seslendirecek suni zeka aracını duyurdu. Sadece sonuçlar şimdilik oldukça iyi değil…
Google’ın suni zeka araştırma laboratuvarı DeepMind, V2A (“videodan ses” ifadesinin kısaltması) isminde suni zeka tarafınca oluşturulan videoları seslendiren yeni aracını duyurdu. DeepMind’ın açıklamasına bakılırsa V2A, sesleri oluştururken hem yazılan açıklamadan yararlanıyor hem de videoyu px px çözümleme ediyor. Bu sayede izahat yazmasanız bile ses oluşturabiliyor.
Videoyu seslendirme üstüne suni zeka araçlarının mühim bulunduğunu söylemek gerek. Zira günümüzde metinden ya da resimden video oluşturabilen pek oldukça suni zeka aracı olsa da bu araçlar çoğunlukla sessiz videolar üretebiliyor. Sadece çoğumuz biliyoruz ki video, görsel olmasıyla birlikte işitsel de bir medya türüdür. Hızla ilerleyen bir tren videosu gördüğümüzde rayların, vagonların ve lokomotifin sesini duyamadığımızda video tesirini yitirmiş oluyor.
V2A’nın suni zeka tarafınca üretilen bir gitar çalma videosunu seslendirdiği örnek
DeepMind, V2A’nın görüntüye uyumlu ses üretme ve sesi otomatikman görüntü ile senkronize etme açısından rakipsiz bulunduğunu öne sürüyor. Sadece paylaşılan örneklere baktığımızda etkilendiğimizi söylemek zor. V2A, görüntüye uygun ses üretiyor sadece daha oldukça görüntüye uyumlu yığın bir sesi dublajlıyor şeklinde görünüyor.
Derhal aşağıdaki örnekler, V2A’nın videoları seslendirme mevzusunda hemen hemen ne kadar ilkel kaldığını anlamanızı sağlayabilir. Gene de bir zamanlar Dall-E’nin de bir zamanlar kanarya çiz denildiğinde tüylü bir sarı top çizdiğini unutmamak gerek. Suni zeka araçları, kullandıkça gelişiyor…


