IBM’in Suni Zekası Resimleri İsimlendirebiliyor

Hızla gelişen suni zekâ, artık resimler için başlık üretebiliyor ve resimleri isimlendirebiliyor. IBM’deki bir grup araştırmacı, resimlerin suni zekâ yardımıyla isimlendirilmesini elde eden bir algoritma geliştirdi.
Resimlere başlık yazmak bunaltan sadece lüzumlu ve çoğu zaman editörler tarafınca sevilmeyen bir iş. Her neyse ki bunu da artık suni zekâ yapabilecekmiş benzer biçimde duruyor. Bilgisayar Görüşü ve Desen Tanıma 2019 adlı konferansta IBM’deki bir grup araştırmacı tarafınca yeni bir model sunuldu. Bu model, resimlere ikna edici bir halde insan yapımı benzer biçimde duran, değişik ve yaratıcı başlıklar üretebiliyor.
Modeli tasarlamak kolay bir süreç değildi. Algoritma tasarlanırken otomatik başlık üretiminin ana sorununu çözmeyi gerektirdi. Bu mesele; söz dizimsel olarak doğru sadece benzeşik, suni ve anlamsal olarak anlaşılmayan cümlelerin ortaya çıkmasıydı. Araştırmacılar, bu problemi dikkat çekme modeli adını verdikleri bir modülle çözdüler. Bu modül, incelemiş olduğu fotoğraftaki kareleri kullanarak cümleler oluşturmasını sağlıyor. Her oluşturma aşamasında takımın yapa zekâ modeli, bundan önceki aşamadan sözlü ya da görsel işaretlerden yararlanma seçimine haiz.
Oluşturulan başlıkların fazla suni olmasını önlemek için araştırma ekibi, ‘Üretken Muhalif Ağ’ (GANs) adını verdikleri bir sistemden yararlandı. Bu iki parçalı ağ, örnek üreten kaynaklardan ve gerçek örnekleri oluşturulmuş örneklerden ayırmaya çalışan bir ayrıştırıcıdan oluşuyordu. Bir başka ayrıştırıcı modülü ise cümlelerin doğallığını ölçüyordu.

Algoritmanın çözmesi ihtiyaç duyulan öteki bir mesele ise aşırı uygunluktu. Aşırı uygunluk, öğrenilen objelerin görünmeyen içeriklerinde ortaya çıkmasına niçin oluyordu. Suni zekânın eğitim verisindeki bu sapmayı önlemek için araştırmacıların bir teşhis aleti inşa etmesi gerekti. Böylelikle araştırmacılar, hangi başlıklarda aşırı uyumluluk bulunduğunu görebildiler.
Başlık üretme algoritması insanlı bir deneye de sokulmuş. Deneyde; insanlardan hangi başlıkların makine tarafınca üretildiğini seçmeleri ve başlıkların, verilen resimlerle ne kadar ilgili olduklarını değerlendirilmesi istenmiş. Modelin gözlem sonucunda iyi performans sergilendiği belirtiliyor.
Araştırmacılar, “Resimlerin otomatikman isimlendirilmesi ve görüntü anlama özelliği, suni zekâyı görme mevzusunda sıkıntısı olan insanoğlu için daha kullanışlı bir hâle getirecek ve onların gündelik yaşamlarını kolaylaştıracak“ şeklinde bir açıklamada da bulunmuş oldu.



