- Web Search: Web'de en güncel bilgileri arar ve alıntı URL'lerini döndürür
- File Search: Yüklenen dosya listesinde semantik/anahtar kelime araması yapar
- Computer Use: Bilgisayarı kontrol eder ve görevleri yerine getirir
- Responses API: Gelişmiş birleşik yanıt arayüzü. Metin/görsel girdisini destekler ve web/dosya arama ile CUA özelliklerinin tamamını kullanabilir
- Agents SDK: Ajan geliştirme için orkestrasyon çatısı
- Uygun bazı geliştiriciler/şirketler, modeli iyileştirmeye yardımcı olmak için istemlerini OpenAI ile paylaşabilir
- Bu yılın Nisan ayı sonuna kadar
gpt-4.5-preview, gpt-4o, o1 için günde en fazla 1 milyon token; gpt-4o-mini, o1-mini, o3-mini için ise en fazla 10 milyon token ücretsiz kullanılabilir
- Uygunluk durumu OpenAI geliştirici panosundan kontrol edilebilir
- ChatGPT'nin en güncel bilgileri sunabilmesi için web'den doğrudan bilgi arayabilir
- İnce ayarlanmış modeller ve arama aracı, Chat Completions API üzerinden doğrudan kullanılabilir
- Chat Completions API'de web aramasının kullanım biçimi
- Model, yanıt vermeden önce her zaman web'de en güncel bilgileri arar
- Web arama aracının (
web_search_preview) yalnızca gerektiğinde kullanılmasını istiyorsanız Responses API'ye geçmeniz gerekir
- Web aramasını kullanabilen modeller
gpt-4o-search-preview
gpt-4o-mini-search-preview
- Modelin yanıt üretmeden önce kullanıcının dosyalarından ilgili bilgileri arayabilmesini sağlar
- Responses API'de sunulur ve yüklenen dosyaların bilgi tabanında semantik arama ve anahtar kelime araması ile bilgi arar
- Vector Store ve semantik aramadan yararlanma
- Bir vektör deposu (Vector Store) oluşturup dosya yükleyerek modelin temel bilgisini genişletebilirsiniz
- Bu, OpenAI tarafından yönetilen bir araçtır; kullanıcının kodu doğrudan kendisinin yazması gerekmez
- Model gerekli görürse aracı otomatik olarak çağırıp dosyalardan bilgi arar ve yanıt üretir
- Kullanım yöntemi
- Önce vektör deposunda bilgi tabanını ayarlayıp dosyaları yüklemek gerekir
- Vektör deposu ayarlandıktan sonra file_search aracı modelin kullanabileceği araçlar listesine eklenebilir
- Şu anda arama aynı anda yalnızca tek bir vektör deposunda yapılabilir (yalnızca tek bir vektör deposu kimliği kullanılabilir)
- Kullanıcının bilgisayarında görevler yerine getirebilen Computer-Using Agent(CUA) modeli tabanlıdır
- GPT-4o'nun görsel işleme ve gelişmiş akıl yürütme yeteneklerini birleştirerek bilgisayar arayüzünü kontrol edebilir ve görevler gerçekleştirebilir
- Responses API üzerinden sunulur; Chat Completions içinde kullanılamaz
- Şu anda beta sürümdedir; güvenlik açıkları veya hatalar yaşanabilir. Tamamen doğrulanmış ortamlar ya da kritik işler için kullanılması önerilmez
- Çalışma şekli
- Model, tıklama(x, y), giriş(text) gibi bilgisayar eylem komutları gönderir
- Kullanıcının kodu bu eylemleri bilgisayar veya tarayıcı ortamında çalıştırır ve sonuç ekran görüntüsünü döndürür
- Model, ekran görüntüsüne dayanarak ortamın durumunu anlar ve sonraki eylemi önerir
- Sürekli döngü sayesinde tıklama, giriş, kaydırma gibi çeşitli eylemler otomatikleştirilebilir
- Kullanım örnekleri: uçuş rezervasyonu, ürün arama, form doldurma
- OpenAI'nin en gelişmiş model arayüzü
- Metin ve görsel girdi desteği sunar, metin çıktısı üretir
- Önceki yanıtın çıktısını bir sonraki girdi olarak kullanabilen durum korumalı etkileşim sağlar
- İşlevsellik genişletilebilir
- Yerleşik araçlarla modelin yetenekleri genişletilebilir
- File Search – Yüklenen dosyalarda semantik ve anahtar kelime araması yapılabilir
- Web Search – Web'deki en güncel bilgiler aranabilir
- Computer Use – Bilgisayar arayüzü kontrol edilip otomasyon görevleri yürütülebilir
- Function Calling – Harici sistemlere ve verilere erişilebilir
- Python fonksiyonları çağrılabilir ve harici sistemlerle etkileşim kurulabilir
- Karmaşık soyutlamalara gerek kalmadan, basit ve kullanımı kolay bir paketle Agent tabanlı yapay zeka uygulamaları geliştirilebilir
- Önceki deneysel platform Swarm'ün üretim seviyesine yükseltilmiş sürümüdür
- Başlıca bileşenler (Primitive):
- Agents – Komutlara ve araçlara sahip LLM tabanlı ajanlar
- Handoffs – Belirli görevlerin başka bir ajana devredilmesi
- Guardrails – Ajanın giriş değerlerini doğrulama ve filtreleme
- Python entegrasyonu ve güçlü özellikler
- Python ile birlikte kullanıldığında araçlar arası güçlü ilişkiler kurulabilir ve karmaşık iş akışları hayata geçirilebilir
- Görselleştirme ve hata ayıklama için Tracing özelliği içerir
- Değerlendirme, hata ayıklama ve model fine-tuning süreçlerini de destekler
- Agents SDK'nin başlıca özellikleri
- Tasarım ilkeleri
- Yeterince güçlü özellikler sunarken, öğrenilecek şey az olduğu için hızlıca alışılabilecek şekilde tasarlanmıştır
- Varsayılan durumda yüksek performans sunar, gerekirse ayrıntılı ayarlar yapılabilir
- Temel işlevler
- Agent Loop: Yerleşik döngü ile araç çağırma → sonuç işleme → LLM yanıtı üretme → sonlandırma süreçlerini otomatik yönetir
- Python-first tasarım: Python dilinin özelliklerini aynen kullanarak ajan bağlantısı ve orkestrasyonu yapılabilir
- Handoffs: Birden fazla ajan arasında görev devri ve koordinasyon sağlanabilir
- Guardrails: Giriş değerlerini doğrular ve paralel kontroller yürütür; hata oluşursa erken sonlandırma yapılabilir
- Function Tools: Python fonksiyonlarını otomatik olarak araca dönüştürür → şema oluşturma ve doğrulama işlemlerini otomatik yapar
- Tracing: Yerleşik izleme işleviyle iş akışını görselleştirme, hata ayıklama, değerlendirme ve iyileştirme yapılabilir
Henüz yorum yok.