Yapay Zeka

Suni Zekâ Firmaları İnternetten Veri Toplamaya Devam Ediyor

Suni zekâ firmalarının, robots.txt olarak da malum yönergeleri atlamış olduğu ortaya çıktı.

Suni zekânın yükselişi ile beraber bu alana giren firmalar, kendi araçlarını geliştirmek için oldukça büyük oranda verilere gerekseme duyuyorlar. Bu verileri bulmak için akla gelen ilk alternatif ise elbet ki web oluyor. Öte taraftan internetteki her veri, her yazı suni zekâ eğitmekte kullanılamıyor. İnternet siteleri, kendilerinden verilerin alınıp alınamayacağını robots.txt adlı bir dosya ile belirtiyor.

Reuters’ın haberine gore oldukça sayıda suni zekâ geliştiricisi bu dosyada yer edinen yönlendirmeleri aşmayı tercih ediyor ve bu sitelerden de veriler topluyorlar. Bilhassa kendisini “parasız suni zekâ arama motoru” olarak tanıtan Perplexity bu mevzuda tepkileri en oldukça üstüne çeken firmalardan biri olsa da bu uygulamada yalnız değil.

OpenAI, Anthropic…

Gelen raporlara gore pek oldukça suni zekâ geliştiricisi robots.txt dosyalarını pas geçerek sitelerden içerik almaya devam ediyor. Raporda isim verilmese de bu firmalar içinde OpenAI ve Anthropic’in de yer almış olduğu öğrenildi. Perplexity tarafınca kullanılan bir sunucunun da bu yönergeleri takip etmediği ortaya çıktı. Perplexity CEO’su Aravind Srinivas daha ilkin yapmış olduğu açıklamada ise firmanın “ilkin protokolü pas geçip sonradan da bu mevzuda yalan söyleme durumunun olmadığını” söylemişti.

Öte taraftan robots.txt protokolü 1990’lı senelerden beri kullanılıyor ve aslen yasal bir bağlayıcılığı yok. Kim bilir bu mevzuda daha sıkı ve daha detaylı yeni bir protokol oluşturmak probleminin çözümüne katkıda bulunacaktır.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu