Meta, Ses Klonlayabilen Suni Zekâsını Duyurdu: Voicebox

Meta, kendi dil modelinin peşinden bu kez ses klonlayabilen ve kaydedilen sesin düzenlenmesini elde eden yeni suni zekâsı Voicebox’ı duyurdu.
Suni zekâ teknolojilerinin gelişimiyle kendimizin yada bir başkasının sesini klonlayabilir, bu sesle cümleler söyletebilir olmuştuk. ElevenLabs ve Uberduck şeklinde platformlar bu mevzuda zirvede bulunurken bugün Meta’dan sürpriz bir hamle geldi.
Meta, suni zekâ ile konuşmalar üretmenizi elde eden yeni “Voicebox” suni zekâsını duyurdu. Voicebox, tıpkı azca ilkin bahsettiklerimiz şeklinde sesinizi klonlamanızı, bu ses ile yazdığınız metni seslendirmenizi sağlıyor. Normal olarak aslolan vaka, metnin seslendirilmesinin tıpkı bir insan şeklinde yapılmasında yatıyor.
Karşınızda Meta’nın ses teknolojisi Voicebox:
https://www.youtube.com/watch?v=5Mnc20YfT7k
- Voicebox ile konuşma seçimi klonlama.
Meta’nın “konuşmada üretken suni zekâlar için çığır açan buluş” olarak paylaşmış olduğu Voicebox, yalnız ses öykünmek etme ve yazılanı okumak şeklinde fonksiyonlara haiz olmayacak. Suni zekâ, bundan değişik dillerde konuşmanızı sağlamak dahil fazlaca daha fazlasını meydana getirecek:
“Voicebox, sesin içeriğini ve stilini korurken yüksek kaliteli ses klipleri üretebilir ve otomobil kornalarını yada köpek havlamasını kaldırmak şeklinde evvelinde kaydedilmiş sesleri düzenleyebilir. Model bununla beraber fazlaca dillidir ve altı dilde konuşma üretebilir.”
Voicebox, sizin sesinizi alarak, İngilizce, Fransızca, Almanca, İspanyolca, Polonyaca yada Portekizce olarak bir içinde ne olduğu seslendirebilecek.
Üstelik değişik dillerde seslendirme için o dilde yazı yada ses sunmanız gerekmeyecek. Suni zekâ, Fransızca bir sesi yada metni İngilizce yada öteki tüm desteklenen dillere çevirebilecek.
Bir tek 2 saniyede ses klonlanabilecek:
Günümüz ses klonlama platformları, klonlama işlemi için minimum 5 dakikalık kayıtlar isterken Meta burada hakkaten çığır açmayı başardı. Şirket, Voicebox’ın yalnız 2 saniyelik bir kayıtla ses stilini öğrenebildiğini ve bu stili seslendirmeye aktarabildiğini açıkladı.
https://www.youtube.com/watch?v=gFeBV8mPwtA
- Ses düzenleme emek harcaması.
Tüm bunların yanı sıra ses kaydı alırken fark etmeden yanlış söyleniş ettiğiniz kelimeler, Voicebox ile suni zekâ vesilesiyle sonradan düzenlenebilecek.
Şirket, Voicebox hakkında araştırma makalesini yayınladı. Ek olarak kullananların suni zekânın ilk seslerini duyabilecekleri demo sayfasını da yayınladı. Sadece suni zekâ, kötüye kullanım ihtimalleri sebebiyle hemen hemen kullanıma sunulmadı. Şimdilik yalnızca bilimsel çalışmalara açık olacak.


