Microsoft’tan Gerçekçi İnsan Videoları Oluşturabilen Model

0 1 dakika okuma süresi

Microsoft, tek bir görsel ve ses kaydı kullanarak gerçekçi insan videoları oluşturabilen VASA-1 modelini tanıttı. Modelin şimdilik geniş çapta kullanıma sunulması planlanmıyor.

Suni zekâ teknolojilerinin en fanatik bırakıcı özelliklerinden biri gerçeğinden ayırt edilemeyen görüntüler ve sesler oluşturabilmeleri. Microsoft araştırmacılarının geliştirdiği “VASA” adlı sistem bunun en yeni örneği.

VASA suni zekâ sistemi, tek bir görseli ve ses kaydını kullanarak hakkaten konuşuyormuş şeklinde görünen yüzler oluşturabiliyor.

VASA-1, sesin yanı sıra gerçekçi yüz ifadeleri de oluşturabiliyor

![Microsoft, Tek Bir Görsel ve Ses Kaydından Ultra Gerçekçi İnsan Videoları Oluşturabilen ](https://imgrosetta.webtekno.com/file/534738/1200xauto.jpg)

Sistemin kullanıldığı ilk modelin adı VASA-1. Modele görsel ve ses kaydı sağlandığında oldukca gerçekçi sonuçlar ortaya çıkıyor. VASA-1; yüz ifadeleri, tamamen uyumlu gecikme olmayan senkronize dudak hareketleri ve organik kafa hareketleri üretebiliyor.

Modelin yapabildikleri dudakları sesle eşleştirmek ve birkaç yüz ifadesiyle sınırı olan değil. Bununla beraber çeşitli duyguları, kişinin suratındaki fark edilmesi zor küçük hareketleri bile algılayabiliyor. Bu şekilde sonuçların ürkütücü derecede inandırıcı olması sağlanıyor.

VASA-1’i kullananlar, oluşturulan videoların üstünde kontrole de haiz olacak. Karakterin bakış yönünü ve mesafeyi ve hatta duygusal durumunu değiştirebilecekler. En dikkat çeken özelliklerinden biri ise her türlü girdiden netice oluşturabilmesi. Sanatla alakalı fotoğraflardan tutun şarkı sözlerine ve İngilizce olmayan konuşmalara kadar birçok değişik türden veriyle yüksek çözünürlüğünde olan video oluşturabiliyor.

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayabilirsiniz.

Microsoft, VASA-1 modelinin eğitim deneyimlerinin geliştirilmesi, kontakt zorluğu yaşayanlara yardım edilmesi şeklinde mevzularda yararlı olabileceğini beyan etti. Paylaşılan görüntülerdeki Mona Lisa dışındaki tüm fotoğrafların DALL-E 3 şeklinde suni zekâ modelleriyle oluşturulduğunu ekleyelim.

Doğal ki bu biçim bir model, bazı endişeleri de bununla beraber getiriyor. Son zamanlarda toplumsal medyada düzmece fotoğraf ve videoların oldukca büyük bir probleme dönüştüğünü görmüştük. VASA-1 şeklinde bir model, bunların sayısını artırabilir. Microsoft da bunun bilincinde bulunduğunu ve izin vermeyeceğini ifade etmiş.

Microsoft’un modeli şimdilik kullanıma sunma şeklinde bir planı yok

Microsoft, bu endişelerden dolayı VASA-1’i şimdilik geniş çapta sunma şeklinde bir planının olmadığını belirtti. Model hakkında iyi mi bir yol izleyeceğini süre gösterecek.