21 puan yazan xguru 2025-03-12 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Web Search: Web'de en güncel bilgileri arar ve alıntı URL'lerini döndürür
  • File Search: Yüklenen dosya listesinde semantik/anahtar kelime araması yapar
  • Computer Use: Bilgisayarı kontrol eder ve görevleri yerine getirir
  • Responses API: Gelişmiş birleşik yanıt arayüzü. Metin/görsel girdisini destekler ve web/dosya arama ile CUA özelliklerinin tamamını kullanabilir
  • Agents SDK: Ajan geliştirme için orkestrasyon çatısı
  • Uygun bazı geliştiriciler/şirketler, modeli iyileştirmeye yardımcı olmak için istemlerini OpenAI ile paylaşabilir
    • Bu yılın Nisan ayı sonuna kadar gpt-4.5-preview, gpt-4o, o1 için günde en fazla 1 milyon token; gpt-4o-mini, o1-mini, o3-mini için ise en fazla 10 milyon token ücretsiz kullanılabilir
    • Uygunluk durumu OpenAI geliştirici panosundan kontrol edilebilir

Web Search

  • ChatGPT'nin en güncel bilgileri sunabilmesi için web'den doğrudan bilgi arayabilir
  • İnce ayarlanmış modeller ve arama aracı, Chat Completions API üzerinden doğrudan kullanılabilir
  • Chat Completions API'de web aramasının kullanım biçimi
    • Model, yanıt vermeden önce her zaman web'de en güncel bilgileri arar
    • Web arama aracının (web_search_preview) yalnızca gerektiğinde kullanılmasını istiyorsanız Responses API'ye geçmeniz gerekir
  • Web aramasını kullanabilen modeller
    • gpt-4o-search-preview
    • gpt-4o-mini-search-preview

File Search

  • Modelin yanıt üretmeden önce kullanıcının dosyalarından ilgili bilgileri arayabilmesini sağlar
  • Responses API'de sunulur ve yüklenen dosyaların bilgi tabanında semantik arama ve anahtar kelime araması ile bilgi arar
  • Vector Store ve semantik aramadan yararlanma
    • Bir vektör deposu (Vector Store) oluşturup dosya yükleyerek modelin temel bilgisini genişletebilirsiniz
    • Bu, OpenAI tarafından yönetilen bir araçtır; kullanıcının kodu doğrudan kendisinin yazması gerekmez
    • Model gerekli görürse aracı otomatik olarak çağırıp dosyalardan bilgi arar ve yanıt üretir
  • Kullanım yöntemi
    • Önce vektör deposunda bilgi tabanını ayarlayıp dosyaları yüklemek gerekir
    • Vektör deposu ayarlandıktan sonra file_search aracı modelin kullanabileceği araçlar listesine eklenebilir
    • Şu anda arama aynı anda yalnızca tek bir vektör deposunda yapılabilir (yalnızca tek bir vektör deposu kimliği kullanılabilir)

Computer Use

  • Kullanıcının bilgisayarında görevler yerine getirebilen Computer-Using Agent(CUA) modeli tabanlıdır
  • GPT-4o'nun görsel işleme ve gelişmiş akıl yürütme yeteneklerini birleştirerek bilgisayar arayüzünü kontrol edebilir ve görevler gerçekleştirebilir
  • Responses API üzerinden sunulur; Chat Completions içinde kullanılamaz
  • Şu anda beta sürümdedir; güvenlik açıkları veya hatalar yaşanabilir. Tamamen doğrulanmış ortamlar ya da kritik işler için kullanılması önerilmez
  • Çalışma şekli
    • Model, tıklama(x, y), giriş(text) gibi bilgisayar eylem komutları gönderir
    • Kullanıcının kodu bu eylemleri bilgisayar veya tarayıcı ortamında çalıştırır ve sonuç ekran görüntüsünü döndürür
    • Model, ekran görüntüsüne dayanarak ortamın durumunu anlar ve sonraki eylemi önerir
    • Sürekli döngü sayesinde tıklama, giriş, kaydırma gibi çeşitli eylemler otomatikleştirilebilir
  • Kullanım örnekleri: uçuş rezervasyonu, ürün arama, form doldurma

Responses API

  • OpenAI'nin en gelişmiş model arayüzü
  • Metin ve görsel girdi desteği sunar, metin çıktısı üretir
  • Önceki yanıtın çıktısını bir sonraki girdi olarak kullanabilen durum korumalı etkileşim sağlar
  • İşlevsellik genişletilebilir
    • Yerleşik araçlarla modelin yetenekleri genişletilebilir
      • File Search – Yüklenen dosyalarda semantik ve anahtar kelime araması yapılabilir
      • Web Search – Web'deki en güncel bilgiler aranabilir
      • Computer Use – Bilgisayar arayüzü kontrol edilip otomasyon görevleri yürütülebilir
    • Function Calling – Harici sistemlere ve verilere erişilebilir
      • Python fonksiyonları çağrılabilir ve harici sistemlerle etkileşim kurulabilir

Agents SDK

  • Karmaşık soyutlamalara gerek kalmadan, basit ve kullanımı kolay bir paketle Agent tabanlı yapay zeka uygulamaları geliştirilebilir
  • Önceki deneysel platform Swarm'ün üretim seviyesine yükseltilmiş sürümüdür
  • Başlıca bileşenler (Primitive):
    • Agents – Komutlara ve araçlara sahip LLM tabanlı ajanlar
    • Handoffs – Belirli görevlerin başka bir ajana devredilmesi
    • Guardrails – Ajanın giriş değerlerini doğrulama ve filtreleme
  • Python entegrasyonu ve güçlü özellikler
    • Python ile birlikte kullanıldığında araçlar arası güçlü ilişkiler kurulabilir ve karmaşık iş akışları hayata geçirilebilir
    • Görselleştirme ve hata ayıklama için Tracing özelliği içerir
    • Değerlendirme, hata ayıklama ve model fine-tuning süreçlerini de destekler
  • Agents SDK'nin başlıca özellikleri
    • Tasarım ilkeleri
      • Yeterince güçlü özellikler sunarken, öğrenilecek şey az olduğu için hızlıca alışılabilecek şekilde tasarlanmıştır
      • Varsayılan durumda yüksek performans sunar, gerekirse ayrıntılı ayarlar yapılabilir
    • Temel işlevler
      • Agent Loop: Yerleşik döngü ile araç çağırma → sonuç işleme → LLM yanıtı üretme → sonlandırma süreçlerini otomatik yönetir
      • Python-first tasarım: Python dilinin özelliklerini aynen kullanarak ajan bağlantısı ve orkestrasyonu yapılabilir
      • Handoffs: Birden fazla ajan arasında görev devri ve koordinasyon sağlanabilir
      • Guardrails: Giriş değerlerini doğrular ve paralel kontroller yürütür; hata oluşursa erken sonlandırma yapılabilir
      • Function Tools: Python fonksiyonlarını otomatik olarak araca dönüştürür → şema oluşturma ve doğrulama işlemlerini otomatik yapar
      • Tracing: Yerleşik izleme işleviyle iş akışını görselleştirme, hata ayıklama, değerlendirme ve iyileştirme yapılabilir

Henüz yorum yok.

Henüz yorum yok.