Yapay Zeka

DeepSeek’ten 2026’nın İlk Büyük Hamlesi: Dev Suni Zekâ Modellerini Ucuza Eğitmenin Formülü Bulunmuş oldu!

Çinli suni zekâ devi DeepSeek, 2026 yılına mHC adını verdiği yeni bir teknik yazı ile girdi. Kurucu Liang Wenfeng imzalı emek verme, devasa modelleri oldukça daha düşük maliyet ve yüksek verimlilikle eğitmeyi vadeden “Manifold-Constrained Hyper-Connections” mimarisini tüm dünyaya duyurdu.

Suni zekâ dünyası 2026’ya oldukça süratli bir giriş yapmış oldu. Çinli suni zekâ devi DeepSeek, yayımladığı yeni teknik yazı ile temel suni zekâ modellerinin eğitiminde kullanılan mimariyi kökten değiştireceğini ileri sürdü. Firmanın kurucusu Liang Wenfeng’in de aralarında bulunmuş olduğu 19 kişilik ekip, modelleri daha uygun maliyetli hâle getirmeyi amaçlıyor.

Bu yeni yöntem, bilhassa kısıtlı işlem gücüyle ABD’li rakiplerine karşı yarışan firmalar için can suyu durumunda olabilir. “Manifold-Constrained Hyper-Connections” (mHC) olarak adlandırılan teknik, modellerin ölçeklenebilirliğini artırırken hesaplama yükünü neredeyse asla artırmıyor.

Manifold-Constrained Hyper-Connections (mHC) nedir ve neyi değiştiriyor?

DeepSeek’in önerilmiş olduğu mHC mimarisi, aslına bakarsak ByteDance tarafınca 2024’te tavsiye edilen Hyper-Connections (HC) çözümünün geliştirilmiş bir versiyonu. Araştırmacılar; bu tekniği 3 milyar, 9 milyar ve 27 milyar parametreli modellerde kontrol ederek sistemin başarısını kanıtladı. Sonuçlar, mHC’nin geleneksel yöntemlere bakılırsa oldukça daha kesin bir büyük ölçekli eğitim sunduğunu gösteriyor.

Mevcut sistemlerde kullanılan ResNet mimarisi, derin ağlarda informasyon akışını stabilize etse de bazı sinyal sorunları yaşatabiliyordu . mHC ise bu süreci belirli bir “manifold” ile kısıtlayarak hafıza maliyetlerini denetim altında tutuyor ve verimliliği maksimize ediyor. Bu durum, gelecek nesil temel modellerin evrimi için yeni bir yol aydınlatabilir.

Başlıksız-1

DeepSeek’in bu teknik makaleyi bizzat CEO Liang Wenfeng vasıtasıyla arXiv’e yüklemesi, sektör analistleri tarafınca mühim bir sinyal olarak görülüyor. Çoğu zaman bu biçim derin teknik paylaşımlar, firmanın bir sonraki büyük modelinin ayak sesleri olarak kabul ediliyor.

Şirket, geçtiğimiz yıl çığır açan R1 modelini Çin’in ulusal tatili arifesinde yayımlamıştı. Bu yıl da benzer bir stratejiyle, Şubat ortasındaki “Bahar Festivali” döneminde yeni bir modelin piyasaya sürülmesi planlanıyor. Suni zekâ eğitiminde maliyetlerin bu denli düşmesi, sektördeki dengeleri tamamen değiştirebilir.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu