Yapay Zeka

Apple, “OpenELM” İsimli Yepyeni Dil Modelleri Yayımladı

Apple, OpenELM adını verdiği minik dil modelleri yayımladı. Üretken suni zekâ modelleri, “Apple, buluta ek olarak aygıt içi suni zekâ özellikleri de sunacak” iddialarını güçlendiriyor.

Haziran ayında iPhone’lara getireceği suni zeka özelliklerini açıklayacak olan Apple, bu mevzuda hamleler hayata geçirmeye devam ediyor. Apple’ın araştırmacıları, son aylarda birden fazla değişik türden suni zekâ modelleri yayımlamıştı. Bunlara bir yenisi daha eklendi.

Araştırmacılar, “OpenELM” adını verdikleri dil modellerini Hugging Face Hub üstünden yayımladı. Bu modeller, üretken suni zekânın cihazlarda iyi mi kullanılacağı mevzusunda bizlere düşünce veriyor.

Modeller, suni zekânın bulut üstünden değil de direkt cihazdan çalışmasını sağlıyor

Açılımı “Açık Kaynaklı Verimli Dil Modelleri” olan bu modeller, e-posta yazma şeklinde metin odaklı görevlerde “oldukça verimli” olarak nitelendirilmişler. Ek olarak açık kaynaklılar ve herhangi bir geliştirici tarafınca kullanılabiliyorlar.

OpenELM modelleri, dört değişik boyuta sahipler ve hakkaten “minik dil modeli” olarak sınıflandırılabilecek seviyedeler. Öyleki ki boyutları sırasıyla 270 milyon parametre, 450 milyon parametre, 1,1 milyar parametre ve 3 milyar parametre. Parametreler, modellerin karar verme aşamasında eğitim veri kümelerinden kaç değişkeni anlayabildiği gösteriyor.

Küçüklüğünü anlamanız için örnek verelim. Microsoft, geçtiğimiz günlerde “en minik suni zekâ modelim” söylediği Phi-3’ü tanıtmıştı. O modelin boyutu 3,8 milyar parametreydi. Apple’ınkiler ise 270 milyona kadar iniyor. Bu kadar minik olmalarının anlamı ne peki? Daha azca maliyetli olmaları ve telefonlar, dizüstü bilgisayarlar şeklinde cihazlarda çalışacak şekilde optimize edilebilmeleri.

Doğrusu iPhone’larda suni zekânın iyi mi çalışacağı hakkında ipucu sağlıyor bu modeller. Yerleşik olarak kullanılabilmeleri, bulut ihtiyacını ortadan kaldırıyor. Apple’ın aygıt içi suni zekâ mevzusunda hamlelerini artırdığını görmüştük. Birkaç gün ilkin Bloomberg’den Mark Gurman, buluta ek olarak tamamen aygıt üstünde çalışan özellikler de geliştirdiğini belirtmişti. Bu modeller de bu iddiayı destek sunar özellikte.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu