OpenAI’nin Yenilikçi ChatGPT Aracısı Tanıtıldı
OpenAI, mevcut iki temel temsilci modeliyle sınırlı kalmayarak, Operatör ve Derin Araştırma ajanlarının yeteneklerini bir araya getiren ve ChatGPT’nin doğal konuşma kabiliyetleriyle bütünleştiren yepyeni bir aracı piyasaya sundu. Bu gelişmiş araç, kullanıcılara web üzerinde detaylı gezinti yapma, kapsamlı analizler gerçekleştirme ve doğal, akıcı sohbetler kurma imkanını tek bir platformda sunuyor.
Kendi Bilgisayarında Gerçek Görevler Yapabilme Özelliği
Yeni ChatGPT aracısı, artık kendi sanal bilgisayar ortamında çalışabiliyor. Bu sayede kullanıcıların taleplerine uygun olarak:
- Web sitelerinde güvenli ve hızlı gezinti yapabiliyor,
- Sonuçları detaylı analiz edip filtreleyebiliyor,
- Gerekirse kullanıcıdan oturum açmasını isteyebiliyor,
- Kod yazma ve çalıştırma işlemlerini gerçekleştirebiliyor,
- Elektronik tablolar, PowerPoint sunumları gibi çeşitli içerikler oluşturabiliyor,
- Ve çok daha çeşitli görevleri yerine getirebiliyor.
Kullanılabilen Gelişmiş Araçlar ve Entegrasyonlar
ChatGPT aracısı, karmaşık görevleri yerine getirebilmek için çeşitli güçlü bileşenlere erişim sağlayabiliyor:
- Görsel kullanıcı arayüzüne sahip gelişmiş web tarayıcı,
- Basit sorgular için metin tabanlı tarayıcı,
- Komut satırı (terminal) ortamı,
- API’lerle doğrudan bağlantı ve iletişim,
- ChatGPT konnektörleri aracılığıyla farklı uygulamalarla sorunsuz entegrasyon.
Görevler Arası Kesintisiz ve Entegre İş Akışı
Bu araç, tüm işlemleri kendi sanal ortamında gerçekleştirdiği için bağlamı sürekli koruyabiliyor. Örneğin, bir web sitesinden dosya indirip, ardından bu dosyayı terminalde düzenleyerek sonuca ulaşmak veya görsel tarayıcıda görüntülemek gibi adımlar, sorunsuz ve yüksek doğrulukla ilerliyor. Bu sayede karmaşık ve çok adımlı görevlerde üstün performans sağlanıyor.
Performans ve Başarı Oranları
OpenAI, bu yeni aracın gerçek dünya uygulamalarında önemli başarılar elde ettiğini belirtiyor. İşte bazı öne çıkan performans değerlendirmeleri:
- HumanEval: Pass@1 skoru 41,6; çoklu denemelerde bu oran 44,4’e yükseliyor.
- SınırMath: %27,4 doğruluk oranı ile dikkat çekiyor.
- DSBench: Veri bilimi alanında insan seviyesini önemli ölçüde aşıyor.
- SpreadsheetBench: %45,5 başarı oranı ile öne çıkarken, Microsoft Excel Copilot %20,0 seviyesinde kalıyor.
- BrowseComp: %68,9 ile yeni bir SOTA (State Of The Art) rekoru kırıyor.
- WebArena: %65,4 ile güçlü performans sergiliyor.
- OpenAI’nin dahili ekonomik görev testleri: Çıktılar, bu testlerin yaklaşık yarısında insan seviyesinde veya daha üstün sonuçlar gösteriyor.
Kullanıma Sunulma ve Erişim Detayları
Yeni “araç modu” şu anda ChatGPT’nin araçlar menüsünde yer alıyor. Kullanıcılar, bu modun nasıl çalıştığını ekrandan takip edebiliyor; işlemler sırasında araya girerek durdurma veya yönlendirme yapabiliyorlar. Bu güçlü ve esnek aracı şu kullanıcı grupları kullanmaya başlayacak:
- Tüm ChatGPT Pro aboneleri, gün sonuna kadar,
- ChatGPT Plus ve Team üyeleri, önümüzdeki birkaç gün içerisinde,
- Kurumsal ve Eğitim kullanıcıları ise önümüzdeki haftalar içinde erişim sağlayabilecekler.
Kullanım Limitleri ve Ekstra Hizmetler
Pro kullanıcılar aylık 400 görev mesajı hakkına sahipken, diğer ücretli kullanıcılar ayda 40 mesajla sınırlı. Ek olarak, ihtiyaç duyulursa kredi tabanlı ve esnek planlar üzerinden ek kullanım satın alınabiliyor.