Alibaba’dan Metinden Video Üreten Suni Zekâ: Wan 2.1

Alibaba, metinlerden video ve görüntüler üreten yeni suni zekâ modeli Wan 2.1’i duyurdu. Açık kaynak kodlu ve parasız suni zekâ, oldukça kaliteli işler yapabiliyor.
Son dönemlerde suni zekâ sektörüne yönelik oldukça mühim işler meydana getiren Çinli e-ticaret devi Alibaba, yeni suni zekâ modeli “Wan 2.1″i duyurdu. Metinlerden fotoğraf ve videolar üretebilen Wan 2.1, en o kadar da açık kaynak kodlu ve parasız olması sebebiyle ilgili çekmeyi başaracak şeklinde görünüyor.
Alibaba tarafınca meydana getirilen açıklamalara nazaran Wan 2.1, “T2V-1.3B”, “T2V-14B”, “I2V-14B-720P” ve “I2V-14B-480P” şeklinde 4 değişik versiyona haiz olacak. Bunlardan en güçlüsü, 14 milyar parametreyi işleyebilecek şekilde dizayn edildi. Sadece bu suni zekâ modelinin mühim bir eksiği var. O şekilde ki en gelişmiş versiyonu kullansanız bile alabileceğiniz en yüksek çözünürlük 720p.
İşte Wan 2.1’in neler sunduğunu gösteren bir video
Yukarıdaki videoda da görebileceğiniz suretiyle Alibaba’nın yeni suni zekâ modeli, oldukça gerçekçi videolar üretebiliyor. Model o şekilde bir duruma gelmiş durumda ki videonun gerçek mi düzmece mi bulunduğunu idrak etmek mümkün değil. Sadece bunun şaşırtıcı olmadığını açıklayalım. Zira video üreten suni zekâ modelleri için bir kontrol olan VBench’e nazaran bu alandaki en iyi model, Wan 2.1.
Eğer siz de Alibaba’nın yeni suni zekâ modelini derhal kontrol etmek isterseniz buradaki bağlantı üstünden GitHub’a, buradaki bağlantı üstünden de Hugging Face’e erişebilirsiniz.



