OpenAI’nin Ajan Geliştirmeye Yönelik Pratik Rehberi

(openai.com)

38 puan yazan GN⁺ 2026-03-13 | Henüz yorum yok. | WhatsApp'ta paylaş

LLM’lerin akıl yürütme, multimodal ve araç kullanma yetenekleri geliştikçe, kullanıcı adına iş akışlarını bağımsız olarak yürüten yeni bir sistem kategorisi olan ajanlar ortaya çıktı
Ajanlar; model (LLM), araçlar (API/harici fonksiyonlar) ve talimatlar (kılavuzlar) olmak üzere üç temel bileşenden oluşur ve tek ajanlı ya da çok ajanlı sistemler olarak orkestre edilebilir
Karmaşık karar alma, bakımı zor kural sistemleri ve yapılandırılmamış veri işleme gerektiren iş akışlarında ajan kullanımı uygundur
Guardrail’ler, veri gizliliğini, içerik güvenliğini ve marka tutarlılığını koruyan çok katmanlı savunma mekanizmalarıdır ve ajan dağıtımının vazgeçilmez bir parçasıdır
Tek bir ajanla başlayıp gerçek kullanıcı doğrulamasıyla kademeli olarak genişleyen yinelemeli yaklaşım, başarılı dağıtımın anahtarıdır

Ajanın tanımı

Ajan, kullanıcı adına bağımsız olarak görevleri yerine getiren bir sistemdir; müşteri hizmetleri sorunlarını çözme, restoran rezervasyonu yapma, kod değişikliklerini commit etme, rapor oluşturma gibi iş akışlarını yürütür
LLM’i entegre eden ancak iş akışının yürütülmesini kontrol etmeyen uygulamalar (basit chatbot’lar, tek turlu LLM’ler, duygu sınıflandırıcıları vb.) ajan değildir
Ajanın temel özellikleri:
- LLM’i kullanarak iş akışının yürütülmesini yönetir ve karar alır; iş akışının ne zaman tamamlandığını anlar ve gerektiğinde davranışını proaktif olarak düzeltir
- Başarısızlık durumunda yürütmeyi durdurur ve kontrolü kullanıcıya geri verir
- Çeşitli araçlara erişerek harici sistemlerle etkileşim kurar; iş akışının mevcut durumuna göre uygun aracı dinamik biçimde seçer, ancak bunu net guardrail’ler içinde yapar

Ne zaman ajan geliştirmelisiniz

Mevcut otomasyonlardan farklı olarak ajanlar, geleneksel deterministik ve kural tabanlı yaklaşımların sınırlarına ulaştığı iş akışları için uygundur
Ödeme dolandırıcılığı analizi örneği: Geleneksel kural motoru, önceden tanımlı ölçütlere göre işlemleri işaretleyen bir kontrol listesi yaklaşımı izlerken, LLM ajanı bağlamı değerlendirir, ince örüntüleri dikkate alır ve açık bir kural ihlali olmasa bile şüpheli etkinlikleri tespit eden deneyimli bir araştırmacı gibi hareket eder
Ajan kullanımının değer kattığı üç tür:
- Karmaşık karar alma: İnce muhakeme, istisnalar ve bağlama duyarlı kararlar gerektiren iş akışları (ör. müşteri hizmetlerinde iade onayı)
- Bakımı zor kurallar: Güncellenmesi maliyetli veya hataya açık, büyük ve karmaşık kural setlerine sahip sistemler (ör. tedarikçi güvenlik incelemesi)
- Yapılandırılmamış veriye yüksek bağımlılık gösteren senaryolar: Doğal dili yorumlama, belgelerden anlam çıkarma, konuşma tabanlı kullanıcı etkileşimi (ör. konut sigortası hasar talebi işleme)
Bu ölçütleri açıkça karşılamıyorsa, deterministik bir çözüm yeterli olabilir

Ajan tasarımının temelleri

Üç temel bileşen
- Model (Model): Ajanın akıl yürütmesini ve karar almasını sağlayan LLM
- Araçlar (Tools): Ajanın eyleme geçmek için kullandığı harici fonksiyonlar veya API’ler
- Talimatlar (Instructions): Ajanın nasıl davranacağını tanımlayan açık kılavuzlar ve guardrail’ler
Model seçimi
- Her görev için en güçlü modele gerek yoktur — basit arama veya niyet sınıflandırma gibi işler küçük ve hızlı modellerle yapılabilir; iade onayı gibi zor görevlerde ise daha güçlü modeller avantaj sağlar
- Prototip aşamasında en güçlü modelle performans tabanı belirleyip, ardından daha küçük modellerle değiştirerek kabul edilebilir sonuç verip vermediğini kontrol etmek etkili bir yaklaşımdır
- Model seçimi ilkeleri:
  - Performans tabanını belirlemek için değerlendirme (eval) kurun
  - En iyi modelle doğruluk hedefine ulaşmaya odaklanın
  - Mümkün olan yerlerde daha küçük modellere geçerek maliyet ve gecikmeyi optimize edin
Araç tanımı
- Araçlar, temel uygulama veya sistemin API’lerini kullanarak ajanın yeteneklerini genişletir
- Legacy sistemlerde API yoksa, computer-use modeli kullanılarak web ve uygulama arayüzleri üzerinden doğrudan etkileşim kurulabilir
- Her araç standartlaştırılmış bir tanıma sahip olmalı; araçlar ile ajanlar arasında esnek çoktan çoğa ilişkiyi desteklemelidir
- İyi belgelenmiş ve kapsamlı biçimde test edilmiş yeniden kullanılabilir araçlar; keşfedilebilirliği artırır, sürüm yönetimini basitleştirir ve yinelenen tanımları önler
- Ajanın ihtiyaç duyduğu üç araç türü:
  - Veri (Data): İş akışını yürütmek için gereken bağlamı ve bilgiyi getirir (ör. transaction DB sorguları, CRM sistemi, PDF okuma, web araması)
  - Eylem (Action): Sistemlerle etkileşime geçerek DB’ye bilgi ekleme, kayıt güncelleme, mesaj gönderme gibi işlemleri yapar (ör. e-posta/SMS gönderme, CRM kaydı güncelleme, müşteri hizmetleri talebini insana devretme)
  - Orkestrasyon (Orchestration): Ajanın kendisinin başka ajanlar için araç görevi görmesi (ör. iade ajanı, araştırma ajanı, yazım ajanı)
Talimatların yapılandırılması
- Yüksek kaliteli talimatlar tüm LLM tabanlı uygulamalar için gereklidir, ancak ajanlarda özellikle daha önemlidir
- Net talimatlar belirsizliği azaltır ve ajanın karar alma sürecini iyileştirerek daha akıcı iş akışı yürütümü ve daha az hataya yol açar
- Ajan talimatları için en iyi uygulamalar:
  - Mevcut belgelerden yararlanın: Var olan operasyon prosedürleri, destek script’leri ve politika belgeleri kullanılarak LLM dostu rutinler oluşturulabilir (müşteri hizmetlerinde rutinler kabaca bilgi tabanındaki tekil belgelere karşılık gelir)
  - Görev ayrıştırma prompt’ları: Yoğun kaynakları daha küçük ve daha net adımlara bölerek belirsizliği en aza indirin
  - Net eylem tanımları: Rutindeki her adımın belirli bir eylem veya çıktıya karşılık geldiğini açıkça belirtin (ör. sipariş numarası isteme, API çağrısıyla hesap ayrıntılarını getirme)
  - Edge case’leri yakalayın: Kullanıcının eksik bilgi vermesi veya beklenmedik sorular sorması gibi yaygın varyasyonları öngörün; bunların nasıl ele alınacağını koşullu adımlar veya dallanmalarla ekleyin
- o1 veya o3‑mini gibi gelişmiş modeller kullanılarak mevcut belgelerden otomatik talimat üretmek de mümkündür

Orkestrasyon

Tek ajanlı sistem
- Tek bir ajan, araçları kademeli olarak ekleyerek birçok görevi yerine getirebilir; bu da karmaşıklığın yönetimini kolaylaştırır ve değerlendirme ile bakımı basitleştirir
- Her orkestrasyon yaklaşımı bir 'run' kavramına ihtiyaç duyar; bu genellikle ajan kapanış koşuluna ulaşana kadar çalışan bir döngü olarak uygulanır
- Yaygın kapanış koşulları: araç çağrısı, belirli yapılandırılmış çıktı, hata veya maksimum tur sayısına ulaşılması
- Agents SDK’de ajan Agents.run() yöntemiyle başlatılır; nihai çıktı araç çağrısı ya da araç çağrısı olmayan model yanıtı geldiğinde döngü sona erer
- Prompt şablonu stratejisi: Çok sayıda ayrı prompt yerine politika değişkenleri alan esnek tek bir temel prompt kullanmak, farklı bağlamlara uyumu ve bakım ile değerlendirmeyi ciddi ölçüde kolaylaştırır
Ne zaman çok ajanlı sisteme geçilmeli
- Genel öneri, önce tek ajanın yeteneklerini sonuna kadar kullanmaktır
- Daha fazla ajan sezgisel bir kavramsal ayrım sunsa da ek karmaşıklık ve operasyon yükü getirir; bu yüzden çoğu durumda araçlarla donatılmış tek bir ajan yeterlidir
- Ajanları bölmek için pratik yönergeler:
  - Karmaşık mantık: Prompt çok sayıda koşul ifadesi (if-then-else dalları) içeriyorsa ve prompt şablonunu büyütmek zorlaşıyorsa, mantığın her bölümünü ayrı bir ajana ayırın
  - Araç aşırı yükü: Sorun araç sayısı değil, benzerlik veya örtüşmedir — açıkça ayrışmış 15’ten fazla aracı başarıyla yöneten uygulamalar olduğu gibi, 10’dan az ama birbirini tekrar eden araçlarla zorlanan durumlar da vardır
Manager pattern (ajanı araç olarak kullanma)
- Merkezi LLM olan "manager", araç çağrıları üzerinden uzmanlaşmış ajan ağını orkestre eder
- Manager, bağlamı veya kontrolü kaybetmeden doğru zamanda uygun ajana görev devreder ve sonuçları birleşik bir etkileşim olarak sentezler
- İş akışının yürütümünü yalnızca tek bir ajanın kontrol etmesi ve kullanıcıya erişmesi gereken akışlar için uygundur
- Örnek: Çeviri ajanı, İspanyolca, Fransızca ve İtalyanca ajanlarını araç olarak çağırır
Merkeziyetsiz pattern (ajanlar arası handoff)
- Ajanın iş akışının yürütümünü başka bir ajana 'handoff' etmesi şeklinde tek yönlü bir geçiş modelidir
- Agents SDK’de handoff, bir araç veya fonksiyon türüdür; handoff fonksiyonu çağrıldığında en güncel konuşma durumu aktarılır ve yeni ajan anında çalışmaya başlar
- Tek bir ajanın merkezi kontrol veya sentez tutmasına gerek olmayan, her ajanın yürütümü devralıp kullanıcıyla doğrudan etkileşime geçtiği yapılara uygundur
- Örnek: Triage ajanı kullanıcı sorgusunu değerlendirir ve teknik destek, satış veya sipariş yönetimi ajanına yönlendirir
Bildirimsel vs bildirimsel olmayan grafikler
- Bazı framework’ler, tüm dallanmaları, döngüleri ve koşulları düğümler (ajanlar) ve kenarlardan (handoff) oluşan bir grafik olarak önceden tanımlayan bildirimsel (declarative) bir yaklaşım kullanır — görsel olarak nettir, ancak iş akışı dinamik ve karmaşık hale geldikçe hantallaşır ve alan özelinde bir dil öğrenmeyi gerektirir
- Agents SDK, code-first yaklaşımını benimser; böylece iş akışı mantığı tanıdık programlama yapılarıyla doğrudan ifade edilir ve tüm grafiği önceden tanımlamadan daha dinamik ve uyarlanabilir ajan orkestrasyonu mümkün olur

Guardrail’ler

Guardrail’lerin rolü
- Veri gizliliği risklerinin (ör. sistem prompt’unun sızmasını önleme) ve itibar risklerinin (ör. model davranışını markayla uyumlu tutma) yönetilmesine yardımcı olur
- Tek bir guardrail yeterli koruma sağlamaz; birden fazla uzmanlaşmış guardrail’in birlikte kullanılması, daha dayanıklı ajanlar oluşturmak için gereklidir
- Guardrail’ler önemli bir bileşendir, ancak güçlü kimlik doğrulama ve yetkilendirme protokolleri, sıkı erişim kontrolleri ve standart yazılım güvenliği önlemleriyle birlikte kullanılmalıdır
Guardrail türleri
- İlgililik sınıflandırıcısı (Relevance classifier): Ajan yanıtının amaçlanan kapsam içinde kalıp kalmadığını doğrular ve konu dışı sorguları işaretler (ör. "Empire State Building’in yüksekliği nedir?" konu dışı olarak işaretlenir)
- Güvenlik sınıflandırıcısı (Safety classifier): Sistem zafiyetlerini suistimal etmeye çalışan jailbreak veya prompt injection gibi güvenli olmayan girdileri tespit eder
- PII filtresi: Model çıktısında kişisel olarak tanımlanabilir bilgilerin (PII) gereksiz ifşasını önler
- Moderation: Nefret söylemi, taciz, şiddet gibi zararlı veya uygunsuz girdileri işaretler
- Araç güvenceleri (Tool safeguards): Her araca salt okunur vs yazma erişimi, geri alınabilirlik, gereken hesap yetkileri ve finansal etki gibi ölçütlere göre düşük/orta/yüksek risk derecesi verir; yüksek riskli işlevler yürütülmeden önce guardrail kontrolünü duraklatma veya insana eskalasyon gibi otomatik aksiyonları tetikler
- Kural tabanlı korumalar (Rules-based protections): Yasaklı terimler veya SQL injection gibi bilinen tehditleri engellemek için engelleme listeleri, girdi uzunluğu sınırı ve regex filtreleri gibi basit deterministik önlemler kullanır
- Çıktı doğrulama (Output validation): Prompt engineering ve içerik kontrolleriyle yanıtların marka değerleriyle uyumlu olup olmadığını doğrular
Guardrail oluşturma yaklaşımı
- Önce halihazırda belirlenmiş risklere yönelik guardrail’leri kurun; yeni zafiyetler keşfedildikçe ek katmanlar ekleyin
- Etkili sezgisel yaklaşım:
  - Veri gizliliği ve içerik güvenliğine odaklanın
  - Yeni guardrail’leri gerçek edge case’lere ve başarısızlık örneklerine dayanarak ekleyin
  - Hem güvenliği hem kullanıcı deneyimini optimize edin ve ajan geliştikçe guardrail’leri ayarlayın
- Agents SDK’de guardrail’ler birinci sınıf bir kavram (first-class concept) olarak ele alınır ve varsayılan olarak iyimser yürütme (optimistic execution) kullanılır — temel ajan önceden çıktı üretirken guardrail’ler eşzamanlı çalışır ve kısıt ihlali olursa istisna tetiklenir
İnsan müdahalesi planı
- İnsan müdahalesi, kullanıcı deneyimini bozmeden ajanın gerçek performansını iyileştirebilen temel bir emniyet mekanizmasıdır
- Özellikle dağıtımın erken aşamalarında önemlidir; başarısızlıkların belirlenmesine, edge case’lerin keşfedilmesine ve sağlam bir değerlendirme döngüsünün kurulmasına katkı sağlar
- İnsan müdahalesi gerektiren iki ana tetikleyici:
  - Başarısızlık eşiğinin aşılması: Ajanın yeniden deneme veya davranışlarına sınır koyun; bu sınır aşıldığında (ör. müşteri niyeti birkaç denemeye rağmen anlaşılamıyorsa) insana eskale edin
  - Yüksek riskli eylemler: Hassas, geri döndürülemez veya yüksek etkili eylemler (ör. kullanıcının siparişini iptal etme, büyük tutarlı iade onayı, ödeme işleme) için, ajana duyulan güven artana kadar insan gözetimi gerekir

Sonuç

Ajanlar; belirsizlik üzerinde akıl yürüten, araçlar üzerinden eyleme geçen ve çok adımlı görevleri yüksek otonomiyle yürüten iş akışı otomasyonunda yeni bir dönemi temsil ediyor
Basit LLM uygulamalarından farklı olarak ajanlar uçtan uca iş akışları yürütür; bu nedenle karmaşık karar alma, yapılandırılmamış veri ve kırılgan kural tabanlı sistemler için uygundur
Güvenilir ajanlar oluşturmak için: yetkin bir model, iyi tanımlanmış araçlar ve net, yapılandırılmış talimatları birleştirin; karmaşıklığa uygun orkestrasyon pattern’leri kullanın, ancak tek ajanla başlayıp yalnızca gerektiğinde çok ajanlı yapıya geçin
Guardrail’ler, girdi filtrelemeden araç kullanımına ve insan müdahalesine kadar her aşamada önemlidir; ajanların production ortamında güvenli ve öngörülebilir biçimde çalışmasını sağlar
Başarılı dağıtım, ya hep ya hiç yaklaşımı değil; küçük başlayıp gerçek kullanıcılarla doğrulama yaparak ve zaman içinde yetenekleri büyüterek ilerleyen yinelemeli bir yaklaşımdır

PDF olarak da sunuluyor

OpenAI’nin Ajan Geliştirmeye Yönelik Pratik Rehberi

Ajanın tanımı

Ne zaman ajan geliştirmelisiniz

Ajan tasarımının temelleri

Üç temel bileşen

Model seçimi

Araç tanımı

Talimatların yapılandırılması

Orkestrasyon

Tek ajanlı sistem

Ne zaman çok ajanlı sisteme geçilmeli

Manager pattern (ajanı araç olarak kullanma)

Merkeziyetsiz pattern (ajanlar arası handoff)

Bildirimsel vs bildirimsel olmayan grafikler

Guardrail’ler

Guardrail’lerin rolü

Guardrail türleri

Guardrail oluşturma yaklaşımı

İnsan müdahalesi planı

Sonuç

İlgili okumalar

Henüz yorum yok.