7 puan yazan GN⁺ 14 일 전 | Henüz yorum yok. | WhatsApp'ta paylaş
  • OpenAI, Agents SDK'yi kapsamlı biçimde güncelleyerek; ajanların dosya inceleme, komut çalıştırma, kod düzenleme ve uzun süreli işleri kontrollü bir sandbox ortamında yürütebilmesi için standartlaştırılmış bir altyapı sundu
  • Yeni harness, yapılandırılabilir bellek, sandbox farkındalığına sahip orkestrasyon, Codex tarzı dosya sistemi araçları, MCP, skills, AGENTS.md, shell, apply patch gibi öncü ajan sistemlerinin temel primitive'lerini bir araya getiriyor
  • Yerel sandbox yürütme desteği sayesinde Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel gibi çeşitli sandbox sağlayıcıları varsayılan olarak destekleniyor; ayrıca özel sandbox'lar da bağlanabiliyor
  • Harness ile hesaplama ortamını ayıran mimari; prompt injection savunması, snapshot tabanlı dayanıklı yürütme ve çoklu container paralelleştirmesiyle güvenlik ve ölçeklenebilirlik sağlıyor
  • API tabanlı standart token ve araç kullanım ücretlendirmesiyle tüm müşteriler için genel erişime (GA) açıldı; TypeScript desteği ile code mode ve subagents özellikleri daha sonra eklenecek

Mevcut ajan sistemlerinin sınırları

  • Geliştiricilerin faydalı ajanlar kurabilmesi için yalnızca en iyi modellere değil; dosya inceleme, komut çalıştırma, kod yazma ve çok aşamalı işleri sürdürebilen sistemlere de ihtiyacı var
  • Mevcut yaklaşımların ödünleşimleri
    • Modelden bağımsız framework'ler esnek olsa da öncü modellerin yeteneklerinden tam yararlanamıyor
    • Model sağlayıcı SDK'ları modele daha yakın olsa da harness üzerinde görünürlük çoğu zaman yetersiz kalıyor
    • Yönetilen ajan API'leri dağıtımı basitleştiriyor ancak ajanın nerede çalıştığına ve hassas verilere nasıl eriştiğine dair sınırlamalar getiriyor

Ajan döngüsü için daha güçlü bir harness

  • Bu sürümle birlikte Agents SDK harness'i; belgeler, dosyalar ve sistemlerle çalışan ajanlara daha güçlü yetenekler sunuyor
  • Yeni entegre edilen temel primitive'ler
    • MCP üzerinden araç kullanımı
    • skills ile progressive disclosure
    • AGENTS.md ile özel talimatlar
    • shell aracı ile kod çalıştırma
    • apply patch aracı ile dosya düzenleme
  • Harness zaman içinde yeni agentic pattern'leri ve primitive'leri entegre etmeyi sürdüreceği için geliştiriciler, çekirdek altyapıyı güncellemek yerine alan odaklı mantığa odaklanabilecek
  • Harness, öncü modellerin en iyi performansı verdiği biçime göre yürütmeyi hizalayarak özellikle uzun süreli işler ya da farklı araç ve sistemler arasında koordinasyon gerektiren karmaşık görevlerde güvenilirlik ve performansı artırıyor
  • Her ürünün kendine özgü gereksinimlerini destekleyecek şekilde tasarlandığı için; araç kullanımı, bellek ve sandbox ortamı gibi unsurlar geliştiricinin mevcut stack'ine uyacak biçimde esnek şekilde ayarlanabiliyor

Yerel sandbox yürütme

  • Güncellenen Agents SDK, sandbox yürütmeyi yerel olarak destekliyor; böylece ajanlar, iş için gereken dosya, araç ve bağımlılıkların bulunduğu kontrollü bir bilgisayar ortamında çalışabiliyor
  • Pek çok faydalı ajanın; dosya okuma/yazma, bağımlılık kurma, kod çalıştırma ve araçları güvenli biçimde kullanmayı mümkün kılan bir çalışma alanına (workspace) ihtiyacı var ve yerel sandbox desteği bunu ayrıca kurmaya gerek bırakmadan varsayılan olarak sunuyor
  • Kendi sandbox'ınızı getirebilir veya Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel gibi yerleşik desteklerden yararlanabilirsiniz
  • Ortamın farklı sağlayıcılar arasında taşınabilir olmasını sağlamak için Manifest soyutlaması sunuluyor
    • Yerel dosya mount etme ve çıktı dizini tanımlama yapılabiliyor
    • AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2 gibi depolama sağlayıcılarından veri alma destekleniyor
  • Geliştiricilere, yerel prototipten production dağıtımına kadar tutarlı bir ortam yapılandırma yöntemi sunuyor
  • Modele; girdilerin nerede olduğu, çıktıların nereye yazılacağı ve uzun süreli işler sırasında çalışmanın nasıl organize edileceği konusunda öngörülebilir bir çalışma alanı sağlıyor

Güvenlik, dayanıklılık ve ölçeklenebilirlik için harness-hesaplama ayrımı

  • Ajan sistemleri prompt injection ve veri sızdırma girişimlerini varsayarak tasarlanmalı; harness ile hesaplama ortamının ayrılması, model tarafından üretilen kodun çalıştığı ortamdan kimlik bilgilerini izole etmeye yardımcı oluyor
  • Dayanıklı yürütme (durable execution) desteği
    • Ajan durumu dışsallaştırıldığında, sandbox container'ının kaybı yürütmenin kaybı anlamına gelmiyor
    • Yerleşik snapshot alma ve yeniden yükleme sayesinde, özgün ortam başarısız olduğunda veya süresi dolduğunda durum son checkpoint'ten yeni bir container üzerinde geri yüklenip yürütme sürdürülebiliyor
  • Ölçeklenebilirlik güçlendiriliyor
    • Ajan yürütmesi bir veya birden fazla sandbox kullanabiliyor
    • Sandbox yalnızca gerektiğinde çağrılıyor ve subagent'lar izole ortamlara yönlendirilebiliyor
    • Çoklu container paralelleştirmesi ile daha hızlı yürütme destekleniyor

Oscar Health müşteri örneği

  • Oscar Health Staff Engineer & AI Tech Lead'i Rachael Burns'e göre, güncellenen Agents SDK sayesinde önceki yaklaşımlarla yeterince güvenilir biçimde ele alınamayan klinik kayıt iş akışı otomasyonu production seviyesinde hayata geçirildi
  • Temel fark, basit metadata çıkarımı değil; uzun ve karmaşık kayıtlarda her encounter boundary'nin doğru biçimde anlaşılması
  • Sonuç olarak her hastanın ziyaret bağlamı daha hızlı anlaşılabiliyor ve bu da hasta bakımı ile deneyiminin iyileştirilmesine katkı sağlıyor

Fiyatlandırma ve sunum şekli

  • Yeni Agents SDK özellikleri, API üzerinden tüm müşteriler için genel erişimde (GA)
  • Standart API fiyatlandırması uygulanıyor (token ve araç kullanımı bazlı ücretlendirme)

Gelecek planları

  • Agents SDK geliştirilmeye devam edecek; amaç, daha az özel altyapıyla daha güçlü ajanları production'a almayı kolaylaştırırken geliştirici esnekliği ve kontrolünü korumak
  • Yeni harness ve sandbox özellikleri önce Python'da sunuluyor; TypeScript desteği sonraki sürümlerde gelecek
  • code mode ve subagents özellikleri üzerinde hem Python hem de TypeScript için çalışılıyor
  • Daha fazla sandbox sağlayıcısı, entegrasyon ve geliştiricilerin hâlihazırda kullandığı araç ve sistemlere bağlanma yolları eklenerek ajan ekosistemiyle entegrasyon genişletilecek

Henüz yorum yok.

Henüz yorum yok.