Suni Zekâ Eğitimi Verilerinde Çocuk İstismarı Bulunmuş oldu

Stanford araştırmacıları, Stable Diffusion tarafınca kullanılan LAION-5B adlı suni zekâ eğitim görsel setinin içinde çocuk istismarına ilişkin bağlantılar buldu, hem de yüzlerce.
Suni zekâların eğitilmesi için oldukça büyük veri setlerine gereksinim duyuluyor. Veri seti ne kadar büyükse suni zekâ da ona bakılırsa daha iyi performans gösteriyor. LAION da suni zekâ geliştiricileri için veri setleri oluşturuyor. Stanford Web Gözlemevi, LAION-5B adlı veri setinde çocuk istismarına ilişkin yüzlerce linki ortaya çıkardı.
LAION-5B, Stable Diffusion’un yaratıcısı olan Stability AI tarafınca da kullanılmıştı. Eylül 2023’te veri setini incelemeye süregelen Stanford’lu araştırmacılar, bu veri setinde çocuk istismarına ilişkin içeriklerin olup olmadığını, var ise kaç tane bulunduğunu ortaya çıkarmayı amaçlıyordu. Emek harcama sonuçlarına bakılırsa minimum 1679 içerikte çocuk tacizini içeren görsellere ilişkin bağlantılar bulunmuş oldu. Bu bilgiler, PhotoDNA ve Kanada Çocuk Koruma Merkezi benzer biçimde kurumlarla da paylaşıldı.
Stable Diffusion’da da bu veri seti kullanılmıştı
LAION’un web sitesinde yer edinen bilgilere bakılırsa veri seti görselleri depolamıyor, görüntülerin metin açıklamalarıyla görüntülerin linklerinin yer almış olduğu bir web indeksi oluşturuyor. Google da Imogen üretken suni zekânın eğitimi için LAION-5B’nin daha eski sürümü olan LAION-400M’i kullanmıştı. Şirket, daha sonraki versiyonlarda 400M’in kullanılmadığını söylerken, Imogen araştırmacıları da veri setinde “çocuk istismarı, ırkçı küfürler ve zararı dokunan toplumsal sterotipler benzer biçimde oldukça sayıda uygunsuz içerik bulunduğunu” belirtmişti.
Stanford araştırmacıları, bu içeriklerin varlığının direkt veri setinin çıktılarını etkilemediğini söylerken, LAION ise bu türden zararı dokunan içeriklere karşı sıfır hoşgörü politikası uyguladıklarını ve geçici bir süreliğine veri setini yayından çekeceklerini deklare etti. Öte taraftan bu verilerle eğitilmiş olan suni zekâları tekrardan eğitmek daha büyük bir problem oluşturuyor.
Daha ilkin de ABD’de eyalet savcıları kongreye, suni zekânın çocuk istismarında kullanımı ve üretken suni zekâlarla bu tür içeriklerin üretiminin engellenmesi için bir komite toplanması çağrısında bulunmuştu.


