Captcha Testlerinde Niçin Trafikle İlgili Görseller Görürüz?

İnternette güvenliğin mühim adımlarından kabul edilen Captcha testlerinde sık sık bazı minik karelerin içinde trafik işaretleri, otobüsler ve bisikletler arıyoruz. Peki niçin elma, armut değil de otomobil, otobüs görselleri görüyoruz?
İnternette sıhhatli bir halde gezinmenin temelde üç bileşeni vardır; sıhhatli bir bağlantı, sıhhatli bir web sitesi ve sıhhatli bir aygıt. Bir sitenin muntazam çalışabilmesi, hücum almaması ya da fena niyetli kişilerden zarar görmemesi için alınan pek oldukca güvenlik önlemi var. Bunların da kim bilir en bilinenlerinden biri Captcha testleri.
Son dönemde Captcha testlerinde devamlı olarak yaya geçitlerini, trafik ışıklarını ya da araçları tanımaya çalışıyoruz. Peki sorulabilecek binlerce değişik şey varken niçin yeterlik kursundaymışız şeklinde devamlı trafikle savaşım ediyoruz?
Bilgisayarlar, trafiği bizim sayemizde çözmeye çalışıyor.
Captcha testi dediğimiz şey, bilgisayarla insanları ayırt etmek için kullanılan kolay bir Turing testi. Turing testi de kabaca insana kolay gelen fakat bilgisayarın çözemediği kontrol çeşidi. Captcha testlerinde sık sık trafikle ilgili görseller görmemizin sebebi ise bu görsellerin bilgisayarlar tarafınca tanınmasının zor olmasıdır.
Bilgisayarlar görselleri bizim şeklinde algılamazlar. Testlerde yer edinen trafik ışıkları, yaya geçitleri, bisikletler, otobüsler şeklinde nesneleri bilgisayarlar görünce tanıyamaz. Bu nesnelerin şekli, rengi, konumu ve arka planı bilgisayarlar için karmaşık olabilir.
Mesela, bir trafik ışığının yeşil bulunduğunu söylemek kolay şeklinde görünse de ışığın parlaklığı, açısı ve çevresindeki öteki nesneler bilgisayarın yanılmasına niçin olabiliyor. Bu yüzden insanlardan bu görselleri ayırmaları istenirken bilgisayarların ya da yazılımların sitelere girişi engelleniyor.
Bilgisayarlar bir şeyleri ayırt etmeyi iyi mi öğreniyor?

Suni zeka yardımıyla bilgisayarlar bir şeyleri öteki şeylerden ayırmayı öğrenebiliyor. Öğrenme süreçleri belli olsa da öğrendikten sonrasında suni zekanın kafasının iyi mi çalıştığını hemen hemen tam olarak bilmiyoruz, karmaşık bir suni ağ işin içine giriyor.
Ilk olarak kendimize bir bot ya da suni zeka yapmadığımız sürece elde edebileceğimiz bilgiler kısıtlı zira suni zekalar ve botlar, firmalar için oldukca kıymetli ve oldukca sıkı korunan ticari sırlardır. Oldukça genel bilgiler haricinde bir detay vermezler. Gene de genel yaklaşım azca oldukca bellidir.
Son yıllarda popüler olan nöral ağ sistemlerine de bir bakalım.

Bilhassa son yıllarda popüler olan nöral ağ sistemleri için temelde iki tane bot üretilir. Bu botlardan ilki yeni botlar üretir, ikincisi ise yeni botları kontrol eder. Yazının buradan sonrasını kafa karıştırmadan anlatmak için bunlara üretici bot, eğitmen bot ve talebe bot diyeceğim.
Üretici bot, talebe botlar üretip bu tarz şeyleri eğitmen bota gönderir. Eğitmen bot yapmak istediğimiz ayrımı bilmez sadece elinde, cevaplanmış sorulardan oluşan bir kontrol vardır. Bu testi talebe botlara uygular. Kontrol sonuçlarıyla beraber öğrencileri, üreticiye geri gönderir.
Çocuklar okuldan dönünce üretici bot, iyi netice alanları kenara ayırıp ötekileri yok eder; yerlerine başarı göstermiş örneklerden yola çıkarak başka talebe botlar yapar. Yeni botlar yapılması ve kontrol edilmesi süreci bir süre döngü olarak devam eder.
İlk başta talihli olan öğrenciler hayatta kalırken, bir noktada artık azca oldukca istenilen işi talih eseri değil, yapısı yardımıyla yapabilen bir bot ortaya çıkar. O bottan sonraki iterasyonlarda hayatta kalmak için ihtiyaç duyulan başarı oranı gittikçe artar.
En sonunda da iyi mi çalıştığını tam bilmesek de başarıyla çalışan bir suni zeka botu elde ederiz. Biz insanoğlu, Captcha testleri ile bu testlere girecek milyarlarca bota uygulanacak milyonlarca soruluk testlerin yanıt anahtarlarını oluşturuyoruz.
Bilgisayarlar, öğrendiklerini elbet kullanacak bölgelere haiz.

Captcha testlerinden gelen bilgiler, ilk aşamada Google Haritalar şeklinde hizmetlerin geliştirilmesinde kullanılıyor. Google, Captcha testlerinde kullandığı trafikle ilgili görselleri insanlardan gelen yanıtlarla eşleştirerek haritalarını daha doğru ve güncel tutmaya çalışır. Böylece, Captcha testleri hem web sitelerinin güvenliğini sağlamak hem de haritalama hizmetlerini iyileştirmek için kullanılır.
Bir öteki nokta ise elbet ki otonom sürüş sistemleri. Bu sistemlerin gelişimi için oldukca büyük oranda veri gerekiyor. Bu kadar büyük veriyi toplamanın en etkili yollarından biri ise internette gezinen milyarlarca insana görseller hakkında sorular sorarak hali hazırda denetim verileri oluşturmaktır.
Şu demek oluyor ki günün sonunda insanoğlu, Captcha testlerinde botları eğitmek için o denli trafik sembolüyle savaşım ediyor. Böylece gelecekte daha doğru haritaları takip eden otonom otomobillerimiz olacak.
Kaynaklar: Natro, Google, Grove Street, The News Wheel



