ChatGPT, Görmeye Başladı [Video] – Webtekno – Güncel Teknoloji Haberleri ve Video İncelemeleri
![ChatGPT, Görmeye Başladı [Video] - Webtekno – Güncel Teknoloji Haberleri ve Video İncelemeleri 1 ChatGPT, Görmeye Başladı [Video] - Webtekno – Güncel Teknoloji Haberleri ve Video İncelemeleri](https://kitapbar.com/wp-content/uploads/2025/12/1765943921_700x400.jpg)
Hayır hayır, doğal ki ChatGPT’nin kendisi görmüyor. Bir tek bir geliştirici, yazdığı yazılımlar ve kullandığı değişik suni zekâ araçlarıyla ChatGPT’nin görmesini sağlıyor.
Üretken suni zekâlar içinde en ön plana çıkanlardan birisi olan ChatGPT, ne yazık ki bizlere oluşturulan sürümünde hemen hemen görselleri ve videoları çözümleme edemiyor. Peki, edebilseydi neler yapabilirdi?
İşte bu probleminin cevabı, suni zekâ geliştiricisi Mckay Wrigley tarafınca verildi. Wrigley, iPhone ve MacBook kullanarak, yazdığı yazılım yardımıyla ChatGPT’ye ‘göz’ verdi. ChatGPT, etraftaki nesnelere gore tavsiyeler de yapmış oldu.
ChatGPT’nin gözlere haiz olduğu video:
Wrigley’nin etrafındaki tüm nesneler ve buzdolabındaki yiyecek ve içecekler, değişik bir suni zekâ ile tanınıyor. Daha sonrasında bu veriler ChatGPT’ye sunuluyor. ChatGPT, bir soruyla ilkin hangi nesnelerin etrafta bulunduğunu öğreniyor, peşinden bu nesnelere ilişkin bir öteki suali da cevaplıyor.
Wrigley, bu yöntem ile ChatGPT’ye buzdolabındaki nesneleri gösteriyor, öğretiyor. Sonrasında ise ChatGPT’den buzdolabındaki içeriklere uygun bir tanım vermesini istiyor. ChatGPT, internette kısa bir arama yaptıktan sonrasında uygun tarifi konu alıyor.
Videodaki sesli konuşma da elbet ChatGPT’nin yapabildiği bir şey değil. Wrigley, yazının anlık olarak sese dönüştürülmesi için OpenAI’ın Whisper suni zekâsından faydalanıyor. Kendisinin kullandığı tüm suni zekâlar ve kullanım amaçları ise şu şekilde:
- GPT-4: ChatGPT’yi oluşturan dil modeli
- YoloV8: Kameraya görünen nesneleri tanımlayan suni zekâ
- Whisper: Metnin sese dönüştürülmesi
- Google Custom Search Engine: ChatGPT’nin internette arama yapmasını elde eden vasıta
Wrigley, bu suni zekâları Python ile yazdığı kodlar ile bir arada çalıştırıyor ve ortaya bu şekilde bir netice çıkıyor. Wrigley, Apple’ın piyasaya sürmeye hazırlandığı artırılmış gerçeklik gözlükleri için de araçlar geliştirmeye hazırlandığını söylüyor.
Bir öteki deyişle yukarıdaki video, artırılmış gerçeklik gözlüklerinin halihazırda bildiğimiz bir potansiyelinin somut bir halde sunumu.



