21 puan yazan GN⁺ 2025-08-07 | 1 yorum | WhatsApp'ta paylaş
  • Mevcut LLM tabanlı ajanlar genellikle araçları tekrar tekrar çağıran basit bir 'yüzeysel (shallow) ajan' yapısına sahipken, Deep Agents karmaşık ve uzun vadeli görevleri de derinlemesine çözebilen planlı ve yapısal yapay zeka ajanlarıdır
  • Deep Research, Manus, Claude Code gibi yeni nesil ajanlar, daha derin konu keşfi ve bağlam yönetimi yapabilen 'deep agent' yaklaşımını hayata geçiriyor
    • Ayrıntılı sistem prompt'ları, planlama araçları, alt ajanlar ve dosya sistemi kullanımı, 'deep agent' yaklaşımının temelini oluşturur
  • LangChain, herkesin kendi vertical'ına (alanına) uygun bir deep agent'ı kolayca oluşturabilmesi için açık kaynak deepagents paketini yayımladı
    • Özel prompt, araç ve alt ajan yapılandırmaları yapılabiliyor; araştırma, geliştirme ve daha birçok alanda uygulanabilecek genel amaçlı bir çerçeve sunuluyor

Mevcut LLM ajanlarının sınırları ve Deep Agents'ın özellikleri

  • Geleneksel ajanlar: LLM döngü içinde yalnızca araç çağırır → kısa bağlam, yalnızca kısa vadeli ve basit işler için uygundur
  • Deep Agents: uzun vadeli hedefleri ve karmaşık görevleri kendi başına parçalayabilir, planlayabilir, takip edebilir ve iş birliği içinde yürütebilir

Deep Agents'ı oluşturan 4 unsur

  1. Ayrıntılı sistem prompt'u

    • Claude Code gibi önde gelen örneklerde olduğu gibi, araç kullanım biçimini ve davranış örneklerini ayrıntılı biçimde tanımlayan prompt'lar kullanılır
    • Karmaşık yönergeler ve few-shot örneklerle daha 'derin' düşünme ve uygulama teşvik edilir
  2. Planlama aracı

    • Gerçek bir işlevi olmasa bile, 'To-Do listesi' gibi planlama araçları rutine dahil edilerek bağlam yönetimi ve yürütme kabiliyeti korunur
    • no-op (hiçbir şey yapmayan) olsa bile prompt içinde bağlam sağlama etkisi vardır
  3. Alt ajanlar (Sub Agents)

    • Alt görevlere göre alt ajanlar oluşturulup iş bölümü yapılır, her ajan bağımsız şekilde çalıştıktan sonra sonuçlar birleştirilir
    • Büyük ölçekli ve karmaşık problemler paralel ve iş bölümlü bir yapıyla ele alınabilir
  4. Dosya sistemi

    • Yalnızca gerçek dosya işlemleri için değil, not ve bağlam deposu olarak da kullanılır
    • Birden çok ajan ve alt ajan, dosya sistemini paylaşarak iş birliği yapabilir ve uzun vadeli bağlamı koruyabilir

LangChain'in Deep Agents çerçevesi: deepagents

  • Açık kaynak Python paketi (pip install deepagents), özel prompt, araç ve alt ajan yapılandırmalarını destekler
    • Claude Code'dan ilham alan sistem prompt'u; daha genel kullanıma uygun hale getirilmiş
    • no-op ToDo listesi planlama aracı (Claude Code ile aynı)
    • Alt ajan oluşturma ve özel olarak tanımlama desteği
    • LangGraph kavramlarını kullanan sanal dosya sistemi (ajan durumunu kullanır)
  • Örnek olarak bir deep research agent şablonu sunuluyor ve vertical'e özgü ajanlar kolayca üretilebiliyor

Kullanım örnekleri ve değeri

  • Araştırma-geliştirme, kod üretimi, araştırma ve karmaşık otomasyon gibi uzun vadeli ve çok katmanlı yapay zeka işleri için optimize edilmiştir
  • Ayrıntılı bağlam tasarımı ve iş bölümü yapısı sayesinde daha derinlikli sonuçlar üretilebilir
  • Herkes kendi alanına uygun bir 'deep agent' kurabilir — yapay zeka kullanımında bir sonraki aşamayı işaret ediyor

1 yorum

 
GN⁺ 2025-08-07
Hacker News görüşleri
  • Yazarı benim. Son zamanlarda claude code, manus, deep research gibi bir dizi ajanın özellikle uzun zaman aralığına yayılan görevleri çok iyi yerine getirmesi etkileyici geliyor. Temelde içeride olan şey, LLM'in döngüye girip araç çağırması. Ama bunu düşünmeden yaptığınızda, LLM'in karmaşık ya da uzun görevleri düzgün şekilde tamamlayamaması gibi bir sorun ortaya çıkıyor. Bu yüzden diğer ajanların bunu nasıl başardığını merak ettim. Ortak olarak gördüğüm noktalar şunlar oldu: 1) planlama aracı kullanıyorlar 2) alt ajanlar kullanıyorlar 3) bağlamı dosya sistemi gibi dışarı taşıyan bir yapı kullanıyorlar 4) ayrıntılı sistem prompt'ları tasarlıyorlar (prompt engineering hâlâ önemli) Bunların her biri zaten var olan yöntemler, ama pratikte ajan geliştirirken yaygın kullanılan yaklaşımlar değiller. Bence asıl önemli içgörü bu kombinasyon. Geri bildirimlere açığım

  • Çeşitli görüşleri düşününce, deep agents kavramının da sonuçta agent + tool kombinasyonundan çok farklı olmadığına katılıyorum. Benim açımdan temel noktalar şunlar: 1) temel bilgi için iyi bir LLM kullanmak gerekir 2) LLM'i doğru yönlendirecek prompt önemlidir (onu bir ajana dönüştürmek için) 3) ayrı bir muhakeme gerektirmeyen işlevler araç olarak uygulanır 4) agent+tool akışı karmaşıklaştığında, odaklı prompt'lara ve az sayıda araca sahip alt ajanlara bölerek her alanı ayırırsınız

    • Sonuçta bunun, en üst düzey ajanın ne yapılacağını seçip hangi ajanın o işe uygun olduğunu dağıttığı bir "orkestratör" modele evrileceğini düşünüyorum. Bu yapı özyinelemeli olarak sürebilir (ör. her ürün için bir ajan olur, o ajan da frontend/backend işlerini üstlenen ajanlara ayrılır). Böyle bir yapıda işi gerçekten yapan ajanlar yalnızca sınırlı bağlama ve araçlara odaklanabilir; üst düzey ajanın ise sadece alt ajanların neler yapabildiğini bilmesi yeterlidir
  • deep agents = planlama eklenmiş ajan + ajan araç kombinasyonu olduğu için sonuçta mevcut ajanlara benziyor diye düşünüyorum. LangChain'in basit kavramları bile hep gereksiz yere karmaşık paketlediğini ve durmadan yeni terim ya da kavram üretip pazarladığını görmek biraz hayal kırıklığı yaratıyor. Tabii LangSmith'i daha çok satmak istiyorlarsa bir yere kadar anlaşılır

    • Eskiden bu tür danışmanlık işleri yapıyordum. Tam olarak birebir aynı diyemem ama özünde yaygın bir numara bu. Sıradan bir şeyi sahne gösterisi gibi paketleyip kendi terimlerini ve sınıflandırmalarını yaratıyor, sonra da onu satıyorsun. Sonraki adım da kendi kavramını SEO ile her yere yaymak oluyor. deep * ve agent gibi popüler anahtar kelimelere binip gidebilirsin… Böyle şeyleri düşününce kurumsal ortamların insanın ruhunu çekip aldığını hissediyorum
  • Bu, beklediğim sonuca oldukça yakın. Artık MCP sunucularını doğrudan yazmanın pek işe yaramadığının netleşmesiyle birlikte, hızlıca akıma katılabilecek yeni bir yönteme ihtiyaç doğdu. gemini ya da claude code gibi doğrudan ajan yapmak bugünlerin trendi. Giriş bariyeri düşük, belli ölçüde faydalı, derin yapay zeka uzmanlığı gerektirmiyor ve pazarlaması da kolay. Bir bakıma “X için cursor” yaklaşımı gibi ama ürüne dönüştürmesi daha da hızlı. Bu şekilde çok sayıda kodlama ajanı çıkacak gibi görünüyor ama şimdilik hâlâ çok yeni bir his vermiyor. Yine de bu kadar hızlı başlanabiliyorsa, sezgisel biçimde yapılmış bir claude code klonunun değerinin kısa sürede sıfıra yaklaşacak olmasını olumlu buluyorum

  • Bu deponun kodunu takip edip analiz etmeye devam ediyorum https://github.com/ghuntley/claude-code-source-code-deobfuscation Yazarı, Claude Code'u tersine mühendislikle incelemiş ve mimarisini iyi açıklıyor. Bağlantıyı daha iyi bir depoyla değiştirdim

    • Bunun ne gösterdiğini açıklayabilir misiniz? Sanki sadece çok büyük bir readme ve sistem komutları varmış gibi görünüyor
  • Rust ile genel amaçlı bir agent CLI+library geliştiriyorum: https://github.com/fdietze/alors Henüz geliştirme sürecinin başında ama bunu geliştirmek için bile şimdiden kullanıyorum. Geri bildirimlere açığım

  • Bana göre Jetbrains'in Junie ürünü, gerçekten yüksek kaliteli bir to do list özelliğini ilk sunan şeydi ve en çok onu beğenmiştim. Ücretli olduktan sonra kullanmadım ama o dönemde Junie yavaş ve temkinliydi. Cursor, sorun olmayan dosyaları bile sürekli üzerine yazıyordu; Claude ise ikisinin arasında bir yerdeydi

    • Cursor, todo list için özel bir UI da sunuyor ve ajanı bunu kullanmaya yönlendiriyor (UX olarak güzel ama dosyanın kendisini doğrudan göremiyorsunuz). Amazon'un kiro ürünü ise tasks.md içinde hem yapılacak işleri hem de spesifikasyonu yönetiyor. Araçlar çoğaldığı için artık size uyanı seçip kullanabiliyorsunuz
  • En ilginç kısım tamamen gizlenmiş. Asıl mesele, araç çağrılarını ayrıştırmadan çalıştırmaya kadar nasıl yönettikleri

  • Alt ajanlarla bağlamı ayırmak gerçekten yenilikçi olan nokta. Geri kalanı sadece langgraph react agent

    • Bunun bir değeri var ama gerçekten tamamen yeni bir fikir değil
  • todo list aracının no-op olmasıyla ilgili daha fazla bilgi olup olmadığını merak ediyorum. Tam olarak nasıl çalıştığını bilmek istiyorum

    • Koddaki hâlini doğrudan görmek isterseniz, yaptığımız Sketch agent TODO list aracını şu şekilde kullanıyor: https://github.com/boldsoftware/sketch/blob/main/claudetool/todo.go Ajanın bunu kullanmasını sağlamak nispeten kolay. İşin büyük kısmı bunu UI içinde görünür kılmakta
    • Ben de aynı soruyu soruyorum. Ne anlama geldiğini tam anlayamadım. Ama bu, Claude Code'un neden üstün olduğuna dair açık bir sebep gibi görünüyor
    • Bence bu sadece basit bir concat işlevi. Gerçekten faydalı prompt tekniklerinin çoğunun uygulanışı zaten basit oluyor. Bu yüzden TODO gibi basit bir fikrin bu kadar ileri gidebilmesi daha da şaşırtıcı! (Ciddi ortamlarda agent framework'leri yine de zor. Örneğin doğru kombinasyonu ve ayarları bulmak gerçekten güç, ayrıca altyapıda multi-tenancy, multi-threading, streaming, cancellation gibi birçok şeyi ele almak gerekiyor.) TODO list'in önemli olduğuna tamamen katılıyorum. louie.ai'nin güvenlik log analizi yarışması gibi örneklerde de bu yöntem sayesinde ciddi hız kazanılıyor. CoT'nin birkaç tur sonra bozulmasını engelliyor. Eğlenceli bir aha moment de şuydu: iç içe todo'lar (A.2.i...) kullanmak faydalı oluyor, ama LLM açısından zaten doğrusal hâle getirildiği için işlemek zor olmuyor. Biz bunu claude code yerine dahili olarak şu tür plan prompt'larıyla yönetiyoruz: https://github.com/graphistry/louie-py/blob/main/ai/prompts/PLAN.md
    • Bağlama sadece araç çağrısının gerçekleştiği gerçeği kaydediliyor. Todo list verisinin kendisi yeniden alınmıyor
    • Benim anladığım kadarıyla bu, sadece TODO listesi yazmasını söyleyen bir prompt gibi düşünülebilir