Meta’nın OpenEQA Sistemiyle Suni Zekâ, Çevreyi Anlayacak

Meta, neyi nerede unuttuğunuzu size söyleyebilecek suni zekâ modellerinin önünü açtı.
Suni zekâ çalışmalarına son dönemde ekstradan ağırlık veren teknoloji devi Meta, bir taraftan toplumsal ağ uygulamalarını yeniliklerle donatırken öte taraftan da suni zekâ yarışında rakiplerini iyi mi geride bırakacağını düşünüyor. Bunun için bir taraftan kendi çipini üretmenin yolunu ararken öteki taraftan da yepyeni hizmetler duyuruyor.
Bunların en yenisi de OpenEQA oldu. Open-Vocabulary Embodied Question Answering şeklinde oluşturulan bu teknoloji yardımıyla suni zekânın, etrafındaki alanları anlayabileceği söyleniyor. Açık kaynaklı yapısı yardımıyla yeni teknoloji, suni zekâ modellerine çevrelerinden ipucu toplayacakları duyular kazandırmayı hedefliyor.
Ofis kartınızı bulamıyor musunuz? Nerede bulunduğunu asistanınıza mesele.
- Kartını yiyecek masasında bıraktın, yiyecek kasesinin yanında.
Tek başına bir ürün olmaktan ziyade hâlihazırdaki bir araca beyin olan OpenEQA sistemi, bir ev robotu yada akıllı gözlükte yaşam bularak bu araçların çevreyi anlayabilmesini sağlayacak. Yalnız anlamakla kalmayacak olan bu sistem, çevre hakkında detayları gerektiği vakit kullanıcıya aktarabilecek.
Meta’nın sunmuş olduğu örnekler, sistemin kullanışlılığını ortaya koyuyor. Mesela evden çıkacaksınız fakat ofis kartınızı bulamıyorsunuz. Akıllı gözlüklerinize kartınızı nerede unuttuğunuzu sorabileceksiniz. Gözlüğünüz de OpenEQA sisteminden almış olduğu görsel bellek kabiliyetiyle kartın, -örneğin- salondaki masanın üstünde bulunduğunu size söyleyebilecek.

- “Evet, yiyecek masasında birazcık muz var.”
Ya da işten eve dönerken evinizdeki robota, evde yiyecek olup olmadığını sorabileceksiniz. Evi devamlı gezen robotunuz da gördüklerinden yola çıkarak yiyecek olup olmadığını size aktarabilecek.
Meta, günümüzdeki VLM’lerin (görsel dil modellerinin) sınırı olan erişime haiz olması sebebiyle standart dil modellerinin pek de üstüne eklemediğini, bu sebeple de OpenEQA sistemini açık kaynak yaptıklarını duyurdu. Zira etrafını insanoğlu benzer biçimde görecek, neyin nerede bulunduğunu görüp aklında tutacak ve gerektiğinde bu bilgiyi insanlara aktaracak bir sistemin gerçek olması için oldukca sayıda uzmanın emek harcaması gerekecek. Sizin düşünceleriniz neler?


