Şimdiye Kadarki En İyi Suni Zekâ Modeli Hangisi?

Suni zekâ modelleri üstünde meydana getirilen testler, en iyi modelin hangisi bulunduğunu ortaya koydu. Testler sonucunda Google Gemini 2.5 Pro’nun performansı, rakiplerinden daha iyiydi.
Suni zekâ sektörü her gün birazcık daha kızışıyorken meydana getirilen testler, dünyanın en iyi suni zekâ modelinin hangisi bulunduğunu gözler önüne serdi. Elde edilmiş bulgular, aslen çok da fazla şaşırtıcı değildi.
Google’ın daha oldukca yeni suni zekâ modeli Gemini 2.5 Pro, girmiş olduğu testlerde öteki modellerden daha iyi sonuçlar elde etti. Üstelik Google Gemini 2.5 Pro ile öteki modeller arasındaki performans farkı hakikaten etkileyiciydi. Model, bazı testlerde rakiplerinin peşinde kalmıştı sadece buradaki puan farkı fazla anlamlı değildi.
Gemini 2.5 Pro, değişik testlerde de daha iyi sonuçlar veriyor!
Google Gemini 2.5 Pro, tek bir testte başarı göstermiş değildi. Matematik özelinde bir kontrol olan MathArena’da kontrol edilen model, rakiplerinden oldukca daha iyi performans gösterdi. Bu modelin puanı yüzde 24,4 olarak kayıtlara geçerken OpenAI, Anthropic ve DeepSeek benzer biçimde firmaların piyasaya sürdüğü suni zekâ modelleri, yüzde 5’i geçemediler. Öte taraftan; suni zekânın bir alanda insanları ne vakit geçtiğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro, rakiplerini geride bırakmıştı.
Doğal bu demek değil ki Gemini 2.5 Pro, tüm alanlarda en iyi suni zekâ modeli. Kodlama özelinde bir kontrol olan LiveCodeBench’e giren model, kıyaslamalarda yüzde 70,4 puan aldı. OpenAI’ın o3-mini modeli aynı testte yüzde 74,1 puan almıştı. Gene yazılımla ilgili bir kontrol olan SWE-bench’te yüzde 63,8 puan alan Gemini 2.5 Pro, yüzde 70,3 puan alan Claude 3.7 Sonnet’in peşinde kaldı.



