DeepSeek’in Temel Teknolojisi Yalnızca 30 Dolara Tekrardan Oluşturuldu

DeepSeek’in rakiplerine kıyasla daha azca maliyete hayata geçirilmesi, Kaliforniya Üniversitesi’nden bir grup araştırmacıya esin oldu.
Kaliforniya Üniversitesi’nden bir grup araştırmacı, Çin’in ileri düzey suni zekâsı DeepSeek’in temel teknolojisini yalnızca 30 dolara tekrardan inşa ettiklerini duyurdu. Bu çarpıcı bulgu, büyük teknoloji şirketlerinin milyar dolarlık yatırımlarının aslen daha uygun maliyetli alternatiflerle mümkün olabileceğini gözler önüne seriyor.
Doktora talibi Jiayi Pan ve ekibi, DeepSeek R1-Zero’nun öğrenme kabiliyetlerini yalnızca 3 milyar parametreye haiz minik bir dil modeliyle yansılamak etti. Model, kendi kendini doğrulama ve arama mekanizmalarını kullanarak yanıtlarını devamlı iyileştirebildi.
Peki bunu mümkün kılan ne?
Araştırmacılar, suni zekâyı kontrol etmek için İngiliz yarışma programı Countdown’dan uyarlanan matematiksel bir bulmaca kullandı. İlk başta rastgele tahminler üreten model, zaman içinde hatalarını düzelterek doğru çözüme ulaşana kadar kendi kendini geliştirmeyi öğrendi. Ek olarak insanların zihinsel olarak büyük sayıları çarpmasına benzer bir yöntemle karmaşık matematiksel işlemleri bölerek çözüm üretmeyi başardı.
Pan, bu gelişmiş kabiliyetlere haiz modelin yalnızca 30 dolara mal bulunduğunu belirtti. Oysa büyük suni zekâ şirketleri, benzer teknolojileri eğitmek için milyonlarca hatta milyarlarca dolar harcıyor. Berkeley ekibinin emek vermesi, daha azca kaynakla bile ileri düzey suni zekâları geliştirmenin mümkün bulunduğunu gösteriyor.
Peki siz bu mevzu hakkında ne düşünüyorsunuz? Düşüncelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.



