Yapay Zeka

OpenAI, En Gelişmiş Dil Modeli GPT-4o’yu Tanıttı

OpenAI, günlerdir beklenen etkinliğini bugün gerçekleştirmiş oldu. Şirket, etkinlikte yeni amiral gemisi modeli GPT-4o’yu tanıttı. Model, gerçek bir insan şeklinde konuşabiliyor, görebiliyor ve duyabiliyor.

Suni zekâ devrimine öncülük eden ve modelleriyle her insanın ağzını açık bırakan OpenAI, bugün günlerdir beklenen etkinliğini gerçekleştirmiş oldu. Şirket, etkinlik esnasında ChatGPT söyleşi botu ve GPT-4 dil modeline gelecek yenilikler de dahil mühim duyurular yapmış oldu.

Bugünkü duyurulardan en fazlaca dikkat çekeni, firmanın yeni amiral gemisi dil modeli GPT-4o’ydu. Bu model, mevcut GPT’den daha iyi performans göstermenin yanı sıra fazlaca daha süratli.

GPT-4o; ses, metin ve görüntü üstünden mantık yürütebiliyor

Firmanın kullanıcılarına sunmuş olacağı yeni GPT-4o modeli, ChatGPT söyleşi botuna güç verecek. GPT’nin önceki sürümlerinden fazlaca daha verimli ve önde olarak vasıflandırılan model, ses, metin ve görüntü üstünden mantık yürütebilecek. Açıklamalara nazaran GPT-4o, yerleşik olarak fazlaca modelli bir suni zekâ modeli. Bu da ses, metin ve görüntüyü anlayıp içerik üretebileceği anlamına geliyor.

Bilhassa sesli cevap tarafında ciddi gelişme bulunduğunu söyleyebiliriz. Kullanıcılar artık modelle daha azca gecikmeli, fazlaca daha gerçekçi hissettiren gerçek zamanlı konuşmalar gerçekleştirebiliyor. OpenAI’ın aktardığına nazaran sese 232 milisaniye kadar düşük bir sürede yanıtlar verebiliyor. Bu neredeyse bir insanla konuşmak kadar süratli. Sesli modda evvelinde gecikmeler averaj 2,8 saniyeydi.

Bunun yanı sıra ChatGPT yanıt verirken sözünü kesip yanıtını değiştirmesini bile isteyebiliyorsunuz. Mesela etkinlikteki canlı demoda OpenAI yöneticileri modelden bir robot hakkında hikâye anlatmasını istiyor. Model konuşurken de sözünü kesip değişik duygularda yapmasını talep ediyorlar. ChatGPT; anında bu değişimi yaparak karşısındakinin isteğini yerine getirebiliyor. O anlara yukarıdaki videodan göz atabilirsiniz.

ChatGPT’yi Adeta İnsana Döndüren, Tamamen Ücretsiz Dil Modeli GPT-4o Tanıtıldı: İşte Ağzınızı Açık Bırakacak Yetenekleri [Video]

Modelin yerleşik olarak gelen gelişmiş görsel yeteneklerinin de demosu yapılmış oldu. Model, cihazın kamerası kanalıyla kendisine gösterilen şeyleri “görüp” yorum yapabiliyor. Mesela bir demoda kâğıda yazılan bir denklem modele yayınlandı ve modelden çözümü için yardım istendi. ChatGPT, çözümü bulmaları için onlara destek oldu. Kâğıda “Seni Seviyorum ChatGPT” yazıldığında ise tıpkı bir insan şeklinde duygusal bir sesle yanıtlar verdi.

Şaşırtıcı derecede iyi bir halde gerçek zamanlı tercüme yapabiliyor

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

Etkinlikteki bir başka demo ise yeni modelin tercüme yetenekleriydi. OpenAI, GPT-4o’nun iyi mi gerçek zamanlı tercüme yapabildiğini gözler önüne serdi. Mira Murati İtalyanca konuşurken öteki OpenAI çalışanları İngilizce konuştu. Model, neredeyse asla gecikme olmadan fazlaca süratli bir halde cümleleri çevirip öteki tarafa aktarabildi.

Masaüstü uygulaması üstünden ekranınızı okuyabiliyor, kodlama mevzusunda destek olabiliyor:

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

GPT-4o’nun bir öteki canlı demosunda kodlama mevzusundaki bazı kabiliyetleri yayınlandı. ChatGPT’nin yeni masaüstü uygulaması üstünden gösterilen bu demoda model, yazılan kodu anlayabildi ve çözümleme edebildi. Ek olarak ne gördüğünü de açıklayabildi.

GPT-4o, kamera kanalıyla size bakıp yorumlar yapabiliyor:

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

OpenAI, etkinlik sona erdikten sonrasında GPT-4o’nun kabiliyetlerinden videolar paylaştı. Mesela birinde modelin ön kamera kanalıyla bir insanla gerçekleştirdiği görüşmeyi görebiliyoruz. ChatGPT, kamera kanalıyla o kişinin iyi mi göründüğünü anlayabiliyor ve görünüşü hakkında yorumlar yapabiliyor. Hatta o kişinin bulunmuş olduğu ortam hakkında bile yorum yapıyor. İnsandan ayırt edilmesi zor bir hâl aldığını söylemek yanlış olmaz.

Bir başka demoda kullanıcının yüzüne bakarak mimiklerini ve duygu durumlarını anlayabildiğini görebiliyoruz. Ona “Yüzündeki gülümseme ve küçük bir heyecanla ç**ok mutlu ve neşeli görünüyorsun.” diyor.

İğneleyici şakalar bile yapıyor:

*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.

Bir başka örnekte ise modelden iğneleyici şakalar yapması isteniyor. GPT-4o, hakkaten de alaycı bir halde konuşup şakalar yapabiliyor.

Sözünü kesip istediğinizi yaptırabilmenize bir örnek:

Bu videoda modelden 10’a kadar sayması isteniyor. Karşısındaki OpenAI çalışanı, saymaya başladıktan sonrasında sözünü kesiyor ve ondan daha süratli saymasını istiyor. Tüm istekleri başarı göstermiş bir halde yerine getirebildiğini, hatta bir bölümde bıkmış şeklinde bir “Tamam” söylediğini bile duyabiliyoruz.

İki GPT-4o söyleşi ediyor, beraber şarkı söylüyor

Bir videoda ise GPT-4o’nun bir başka GPT-4o ile söyleşi ettiğini görebiliyoruz. Hatta videonun sonlarına doğru düet yaparak şarkı bile söylüyorlar.

Model, bir köpek görünce ise bu şekilde tepki veriyor:

Görme engellilerin “gözü” olabiliyor

Bir başka örnekte modelin görme yeteneklerinin fazlaca yararlı olabilecek bir kullanım alanına göz atıyoruz. Burada model, görme engelli bir bireye etrafı anlatarak âdeta onun gözü oluyor.

GPT-4o, parasız kullanıcılar tarafınca da kullanılabilecek!

ChatGPT’yi Adeta İnsana Döndüren, Tamamen Ücretsiz Dil Modeli GPT-4o Tanıtıldı: İşte Ağzınızı Açık Bırakacak Yetenekleri [Video]

OpenAI, dil modeliyle ilgili fazlaca sevindirici bir haber de verdi. Firmanın aktardığına nazaran GPT-4o, ChatGPT’nin parasız sürümü üstünden herhangi bir para ödemeden kullanılabilecek. Sadece bir bildiri limit olacak. Bu limit aşıldığında otomatikman GPT-3.5’a geri dönülecek. Şirket, GPT-4o’nun metin ve görüntü yeteneklerinin bugün itibarıyla kullanıma sunulmaya başladığını belirtti. Yeni ses modunun ise ileriki zamanlarda Plus kullanıcıalrına geleceği aktarıldı.



İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu