Agents SDK'nin yeni nesil evrimi

(openai.com)

7 puan yazan GN⁺ 14 일 전 | Henüz yorum yok. | WhatsApp'ta paylaş

OpenAI, Agents SDK'yi kapsamlı biçimde güncelleyerek; ajanların dosya inceleme, komut çalıştırma, kod düzenleme ve uzun süreli işleri kontrollü bir sandbox ortamında yürütebilmesi için standartlaştırılmış bir altyapı sundu
Yeni harness, yapılandırılabilir bellek, sandbox farkındalığına sahip orkestrasyon, Codex tarzı dosya sistemi araçları, MCP, skills, AGENTS.md, shell, apply patch gibi öncü ajan sistemlerinin temel primitive'lerini bir araya getiriyor
Yerel sandbox yürütme desteği sayesinde Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel gibi çeşitli sandbox sağlayıcıları varsayılan olarak destekleniyor; ayrıca özel sandbox'lar da bağlanabiliyor
Harness ile hesaplama ortamını ayıran mimari; prompt injection savunması, snapshot tabanlı dayanıklı yürütme ve çoklu container paralelleştirmesiyle güvenlik ve ölçeklenebilirlik sağlıyor
API tabanlı standart token ve araç kullanım ücretlendirmesiyle tüm müşteriler için genel erişime (GA) açıldı; TypeScript desteği ile code mode ve subagents özellikleri daha sonra eklenecek

Mevcut ajan sistemlerinin sınırları

Geliştiricilerin faydalı ajanlar kurabilmesi için yalnızca en iyi modellere değil; dosya inceleme, komut çalıştırma, kod yazma ve çok aşamalı işleri sürdürebilen sistemlere de ihtiyacı var
Mevcut yaklaşımların ödünleşimleri
- Modelden bağımsız framework'ler esnek olsa da öncü modellerin yeteneklerinden tam yararlanamıyor
- Model sağlayıcı SDK'ları modele daha yakın olsa da harness üzerinde görünürlük çoğu zaman yetersiz kalıyor
- Yönetilen ajan API'leri dağıtımı basitleştiriyor ancak ajanın nerede çalıştığına ve hassas verilere nasıl eriştiğine dair sınırlamalar getiriyor

Bu sürümle birlikte Agents SDK harness'i; belgeler, dosyalar ve sistemlerle çalışan ajanlara daha güçlü yetenekler sunuyor
Yeni entegre edilen temel primitive'ler
- MCP üzerinden araç kullanımı
- skills ile progressive disclosure
- AGENTS.md ile özel talimatlar
- shell aracı ile kod çalıştırma
- apply patch aracı ile dosya düzenleme
Harness zaman içinde yeni agentic pattern'leri ve primitive'leri entegre etmeyi sürdüreceği için geliştiriciler, çekirdek altyapıyı güncellemek yerine alan odaklı mantığa odaklanabilecek
Harness, öncü modellerin en iyi performansı verdiği biçime göre yürütmeyi hizalayarak özellikle uzun süreli işler ya da farklı araç ve sistemler arasında koordinasyon gerektiren karmaşık görevlerde güvenilirlik ve performansı artırıyor
Her ürünün kendine özgü gereksinimlerini destekleyecek şekilde tasarlandığı için; araç kullanımı, bellek ve sandbox ortamı gibi unsurlar geliştiricinin mevcut stack'ine uyacak biçimde esnek şekilde ayarlanabiliyor

Güncellenen Agents SDK, sandbox yürütmeyi yerel olarak destekliyor; böylece ajanlar, iş için gereken dosya, araç ve bağımlılıkların bulunduğu kontrollü bir bilgisayar ortamında çalışabiliyor
Pek çok faydalı ajanın; dosya okuma/yazma, bağımlılık kurma, kod çalıştırma ve araçları güvenli biçimde kullanmayı mümkün kılan bir çalışma alanına (workspace) ihtiyacı var ve yerel sandbox desteği bunu ayrıca kurmaya gerek bırakmadan varsayılan olarak sunuyor
Kendi sandbox'ınızı getirebilir veya Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel gibi yerleşik desteklerden yararlanabilirsiniz
Ortamın farklı sağlayıcılar arasında taşınabilir olmasını sağlamak için Manifest soyutlaması sunuluyor
- Yerel dosya mount etme ve çıktı dizini tanımlama yapılabiliyor
- AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2 gibi depolama sağlayıcılarından veri alma destekleniyor
Geliştiricilere, yerel prototipten production dağıtımına kadar tutarlı bir ortam yapılandırma yöntemi sunuyor
Modele; girdilerin nerede olduğu, çıktıların nereye yazılacağı ve uzun süreli işler sırasında çalışmanın nasıl organize edileceği konusunda öngörülebilir bir çalışma alanı sağlıyor

Ajan sistemleri prompt injection ve veri sızdırma girişimlerini varsayarak tasarlanmalı; harness ile hesaplama ortamının ayrılması, model tarafından üretilen kodun çalıştığı ortamdan kimlik bilgilerini izole etmeye yardımcı oluyor
Dayanıklı yürütme (durable execution) desteği
- Ajan durumu dışsallaştırıldığında, sandbox container'ının kaybı yürütmenin kaybı anlamına gelmiyor
- Yerleşik snapshot alma ve yeniden yükleme sayesinde, özgün ortam başarısız olduğunda veya süresi dolduğunda durum son checkpoint'ten yeni bir container üzerinde geri yüklenip yürütme sürdürülebiliyor
Ölçeklenebilirlik güçlendiriliyor
- Ajan yürütmesi bir veya birden fazla sandbox kullanabiliyor
- Sandbox yalnızca gerektiğinde çağrılıyor ve subagent'lar izole ortamlara yönlendirilebiliyor
- Çoklu container paralelleştirmesi ile daha hızlı yürütme destekleniyor

Oscar Health Staff Engineer & AI Tech Lead'i Rachael Burns'e göre, güncellenen Agents SDK sayesinde önceki yaklaşımlarla yeterince güvenilir biçimde ele alınamayan klinik kayıt iş akışı otomasyonu production seviyesinde hayata geçirildi
Temel fark, basit metadata çıkarımı değil; uzun ve karmaşık kayıtlarda her encounter boundary'nin doğru biçimde anlaşılması
Sonuç olarak her hastanın ziyaret bağlamı daha hızlı anlaşılabiliyor ve bu da hasta bakımı ile deneyiminin iyileştirilmesine katkı sağlıyor

Yeni Agents SDK özellikleri, API üzerinden tüm müşteriler için genel erişimde (GA)
Standart API fiyatlandırması uygulanıyor (token ve araç kullanımı bazlı ücretlendirme)

Agents SDK geliştirilmeye devam edecek; amaç, daha az özel altyapıyla daha güçlü ajanları production'a almayı kolaylaştırırken geliştirici esnekliği ve kontrolünü korumak
Yeni harness ve sandbox özellikleri önce Python'da sunuluyor; TypeScript desteği sonraki sürümlerde gelecek
code mode ve subagents özellikleri üzerinde hem Python hem de TypeScript için çalışılıyor
Daha fazla sandbox sağlayıcısı, entegrasyon ve geliştiricilerin hâlihazırda kullandığı araç ve sistemlere bağlanma yolları eklenerek ajan ekosistemiyle entegrasyon genişletilecek