NVIDIA Fugatto Metinden Ses Oluşturan Suni Zekâ Tanıtıldı

NVIDIA, metinle verilen komutlardan ses dosyası oluşturabilen suni zekâ aracı Fugatto’yu tanıttı.
Hem donanımları hem de modelleri ile suni zekâ alanının en mühim oyuncuları içinde yer edinen NVIDIA, “ses için İsviçre çakısı” olarak nitelendirdiği yeni deneysel üretken suni zekâ modeli olan Fugatto’yu (Foundational Generative Audio Transformer Opus 1) tanıttı.
Fugatto, isim olarak lügatımızda füg dediğimiz oldukça sesli ve yine eden melodilerden oluşan besteleme modelinin adı Fugato’ya oldukça benziyor. Bu da boşuna değil, suni zekâ modeli de “oldukça sesli” ve değişik aksanları ve değişik dilleri de algılayabilmesi için dünyanın dört bir yanından araştırmacılar tarafınca geliştirildi.
Sesleri insanların anladığı benzer biçimde anlayacak
Mevzuyla ilgili açıklamalarda bulunan NVIDIA Uygulamalı Ses Araştırmaları Yöneticisi Rafael Valle, “İnsanların sesleri anladığı ve ürettiği benzer biçimde anlayan bir model oluşturmak istedik.” ifadesini kullandı. NVIDIA, Fugatto’nun gerçek dünyadaki ihtimaller içinde kullanım senaryolarına da duyurusunda yer verdi. Bu senaryolar içinde bir şarkı fikrinin prototipini oluşturmak, değişik tarzlar, sesler ve enstrümanları tecrübe etmek yer aldı.
Kullanıcılar ek olarak bu modelle beraber değişik ses tonlarıyla ve aksanlarla dil öğrenebilecek, oyun geliştiricileri aynı sesin varyasyonlarını üretmek için modelden yardım alabilecekler. Ek olarak bu model, küçük ayarlarla daha ilkin eğitilmediği alanlarda da kullanılabiliyor.
Fugatto’nun kamunun erişimine açılıp açılmayacağı ise belirtilmedi. Daha ilkin Meta ve Google da benzer suni zekâ modelleri geliştirmişti.


