Meta’dan Metinden Müzik Üreten Suni Zekâ Modeli: MusicGen

Meta, yeni suni zekâ dil modeli MusicGen’i duyurdu. Model, metin komutlarıyla müzik üretebiliyor.
Birçok teknoloji devi suni zekâ alanında hamleler hayata geçirmeye devam ediyor. Feysbuk ve Instagram’ın çatı şirketi Meta da bunlardan biri. Mark Zuckerberg yönetimindeki şirket, birkaç hafta ilkin suni zekâ için kendi hususi çipini geliştirdiğini duyurmuştu.
Meta’dan şimdi ise bir başka suni zekâ adımı geldi. Meta’nın Audiocraft araştırma ekibi, MusicGen adlı bir açık kaynaklı dil modelini duyurdu.
MusicGen, metinden müzik üretebiliyor
ChatGPT’nin sesli versiyonu diyebileceğimiz MusicGen modeli, metin komutlarıyla yeni müzikler üretebiliyor. Kullanıcılar, istediği müzik tarzını tanımlayarak modeli kullanabiliyor. Eğer isterlerse mevcut bir melodiyi de ekleyebiliyorlar.
Meta’da yapay zekâ araştırmacısı Felix Kreuk tarafından paylaşılan bir video MusicGen’in nasıl yeteneklere sahip olduğunu ortaya koyuyor. Videoda hâlihazırda bir müziğin eklendiği, sonrasında ise bir komut girerek bu müziğin değiştirilebildiği görülüyor. Bir diğer videoda ise herhangi bir hazır ses kullanılmadan “akılda kalıcı melodiler, tropikal vurmalı çalgılar ve hareketli ritimler içeren plaj için uygun pop dans şarkısı” komutu yazılarak bir ses oluşturulabildiği görülüyor.
Araştırma ekibi, 12 saniye civarında ses üretebilen modelin eğitimi için dahili bir veri kümesinden 10.000 yüksek kaliteli müziğin yanı sıra Shutterstock ve Pond5 parçaları dahil 20.000 saatlik lisanslı müzik kullandı. MusicGen’in Hugging Face AI üzerinden bir demosuna ulaşmak mümkün.
Müzik üretiminde suni zekâ kullanımı hızla artıyor. Bundan birkaç ay ilkin de Google, metinleri müziğe dönüştüren MusicLM adlı yeni suni zekâ modelini duyurmuştu.


