Agents SDK'nin yeni nesil evrimi
(openai.com)- OpenAI, Agents SDK'yi kapsamlı biçimde güncelleyerek; ajanların dosya inceleme, komut çalıştırma, kod düzenleme ve uzun süreli işleri kontrollü bir sandbox ortamında yürütebilmesi için standartlaştırılmış bir altyapı sundu
- Yeni harness, yapılandırılabilir bellek, sandbox farkındalığına sahip orkestrasyon, Codex tarzı dosya sistemi araçları, MCP, skills, AGENTS.md, shell, apply patch gibi öncü ajan sistemlerinin temel primitive'lerini bir araya getiriyor
- Yerel sandbox yürütme desteği sayesinde Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel gibi çeşitli sandbox sağlayıcıları varsayılan olarak destekleniyor; ayrıca özel sandbox'lar da bağlanabiliyor
- Harness ile hesaplama ortamını ayıran mimari; prompt injection savunması, snapshot tabanlı dayanıklı yürütme ve çoklu container paralelleştirmesiyle güvenlik ve ölçeklenebilirlik sağlıyor
- API tabanlı standart token ve araç kullanım ücretlendirmesiyle tüm müşteriler için genel erişime (GA) açıldı; TypeScript desteği ile code mode ve subagents özellikleri daha sonra eklenecek
Mevcut ajan sistemlerinin sınırları
- Geliştiricilerin faydalı ajanlar kurabilmesi için yalnızca en iyi modellere değil; dosya inceleme, komut çalıştırma, kod yazma ve çok aşamalı işleri sürdürebilen sistemlere de ihtiyacı var
- Mevcut yaklaşımların ödünleşimleri
- Modelden bağımsız framework'ler esnek olsa da öncü modellerin yeteneklerinden tam yararlanamıyor
- Model sağlayıcı SDK'ları modele daha yakın olsa da harness üzerinde görünürlük çoğu zaman yetersiz kalıyor
- Yönetilen ajan API'leri dağıtımı basitleştiriyor ancak ajanın nerede çalıştığına ve hassas verilere nasıl eriştiğine dair sınırlamalar getiriyor
Ajan döngüsü için daha güçlü bir harness
- Bu sürümle birlikte Agents SDK harness'i; belgeler, dosyalar ve sistemlerle çalışan ajanlara daha güçlü yetenekler sunuyor
- Yeni entegre edilen temel primitive'ler
- MCP üzerinden araç kullanımı
- skills ile progressive disclosure
- AGENTS.md ile özel talimatlar
- shell aracı ile kod çalıştırma
- apply patch aracı ile dosya düzenleme
- Harness zaman içinde yeni agentic pattern'leri ve primitive'leri entegre etmeyi sürdüreceği için geliştiriciler, çekirdek altyapıyı güncellemek yerine alan odaklı mantığa odaklanabilecek
- Harness, öncü modellerin en iyi performansı verdiği biçime göre yürütmeyi hizalayarak özellikle uzun süreli işler ya da farklı araç ve sistemler arasında koordinasyon gerektiren karmaşık görevlerde güvenilirlik ve performansı artırıyor
- Her ürünün kendine özgü gereksinimlerini destekleyecek şekilde tasarlandığı için; araç kullanımı, bellek ve sandbox ortamı gibi unsurlar geliştiricinin mevcut stack'ine uyacak biçimde esnek şekilde ayarlanabiliyor
Yerel sandbox yürütme
- Güncellenen Agents SDK, sandbox yürütmeyi yerel olarak destekliyor; böylece ajanlar, iş için gereken dosya, araç ve bağımlılıkların bulunduğu kontrollü bir bilgisayar ortamında çalışabiliyor
- Pek çok faydalı ajanın; dosya okuma/yazma, bağımlılık kurma, kod çalıştırma ve araçları güvenli biçimde kullanmayı mümkün kılan bir çalışma alanına (workspace) ihtiyacı var ve yerel sandbox desteği bunu ayrıca kurmaya gerek bırakmadan varsayılan olarak sunuyor
- Kendi sandbox'ınızı getirebilir veya Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel gibi yerleşik desteklerden yararlanabilirsiniz
- Ortamın farklı sağlayıcılar arasında taşınabilir olmasını sağlamak için Manifest soyutlaması sunuluyor
- Yerel dosya mount etme ve çıktı dizini tanımlama yapılabiliyor
- AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2 gibi depolama sağlayıcılarından veri alma destekleniyor
- Geliştiricilere, yerel prototipten production dağıtımına kadar tutarlı bir ortam yapılandırma yöntemi sunuyor
- Modele; girdilerin nerede olduğu, çıktıların nereye yazılacağı ve uzun süreli işler sırasında çalışmanın nasıl organize edileceği konusunda öngörülebilir bir çalışma alanı sağlıyor
Güvenlik, dayanıklılık ve ölçeklenebilirlik için harness-hesaplama ayrımı
- Ajan sistemleri prompt injection ve veri sızdırma girişimlerini varsayarak tasarlanmalı; harness ile hesaplama ortamının ayrılması, model tarafından üretilen kodun çalıştığı ortamdan kimlik bilgilerini izole etmeye yardımcı oluyor
- Dayanıklı yürütme (durable execution) desteği
- Ajan durumu dışsallaştırıldığında, sandbox container'ının kaybı yürütmenin kaybı anlamına gelmiyor
- Yerleşik snapshot alma ve yeniden yükleme sayesinde, özgün ortam başarısız olduğunda veya süresi dolduğunda durum son checkpoint'ten yeni bir container üzerinde geri yüklenip yürütme sürdürülebiliyor
- Ölçeklenebilirlik güçlendiriliyor
- Ajan yürütmesi bir veya birden fazla sandbox kullanabiliyor
- Sandbox yalnızca gerektiğinde çağrılıyor ve subagent'lar izole ortamlara yönlendirilebiliyor
- Çoklu container paralelleştirmesi ile daha hızlı yürütme destekleniyor
Oscar Health müşteri örneği
- Oscar Health Staff Engineer & AI Tech Lead'i Rachael Burns'e göre, güncellenen Agents SDK sayesinde önceki yaklaşımlarla yeterince güvenilir biçimde ele alınamayan klinik kayıt iş akışı otomasyonu production seviyesinde hayata geçirildi
- Temel fark, basit metadata çıkarımı değil; uzun ve karmaşık kayıtlarda her encounter boundary'nin doğru biçimde anlaşılması
- Sonuç olarak her hastanın ziyaret bağlamı daha hızlı anlaşılabiliyor ve bu da hasta bakımı ile deneyiminin iyileştirilmesine katkı sağlıyor
Fiyatlandırma ve sunum şekli
- Yeni Agents SDK özellikleri, API üzerinden tüm müşteriler için genel erişimde (GA)
- Standart API fiyatlandırması uygulanıyor (token ve araç kullanımı bazlı ücretlendirme)
Gelecek planları
- Agents SDK geliştirilmeye devam edecek; amaç, daha az özel altyapıyla daha güçlü ajanları production'a almayı kolaylaştırırken geliştirici esnekliği ve kontrolünü korumak
- Yeni harness ve sandbox özellikleri önce Python'da sunuluyor; TypeScript desteği sonraki sürümlerde gelecek
- code mode ve subagents özellikleri üzerinde hem Python hem de TypeScript için çalışılıyor
- Daha fazla sandbox sağlayıcısı, entegrasyon ve geliştiricilerin hâlihazırda kullandığı araç ve sistemlere bağlanma yolları eklenerek ajan ekosistemiyle entegrasyon genişletilecek
Henüz yorum yok.