7 puan yazan davespark 2025-11-28 | Henüz yorum yok. | WhatsApp'ta paylaş

Geleneksel yazılım mühendisliği alışkanlıklarının (deterministik, sıkı kontrol), AI ajan geliştirmede (olasılıksal, esneklik odaklı) aksine engel olabildiğini anlatıyor.

  • Hugging Face'ten Philipp Schmid'in işaret ettiğine göre, geliştirici ne kadar kıdemliyse LLM'nin belirsizliğini “kodla ortadan kaldırmaya” çalışma eğilimi o kadar artıyor ve bu da onları junior geliştiricilerden daha yavaş hale getiriyor.
  • Benzetme: hava trafik kontrolörü (geleneksel) → dispatcher (ajan) rolüne geçiş gerekli.
  1. Metin yeni durumdur (State)
    • Tuzak: Doğal dil girdisini yapılandırılmış veriye (ör. true/false) zorlamak bağlam kaybına yol açar.
    • Çözüm: Geri bildirimi (ör. “onaylandı, ABD pazarına odaklan”) metin olarak koruyarak dinamik ayarlama yapmak.

  2. Kontrolü devret
    • Tuzak: Akışı hardcode etmek (ör. abonelik iptali rotası), doğrusal olmayan etkileşimlere yanıt verememeye neden olur.
    • Çözüm: Ajanın (LLM) bağlama göre niyeti değerlendirmesine güvenmek.

  3. Hata sadece başka bir girdidir
    • Tuzak: Hata oluştuğunda programı durdurmak (geleneksel yaklaşım), yüksek maliyetli çalıştırmaları boşa harcar.
    • Çözüm: Hatayı geri bildirim olarak verip ajanın kendi kendini onarmayı denemesini sağlamak.

  4. Unit testten Eval'e
    • Tuzak: İkili testleri (TDD) uygulamak, olasılıksal sistemlerde anlamsızdır (sonsuz sayıda geçerli yanıt olabilir).
    • Çözüm: Güvenilirliği (Pass@k), kaliteyi (LLM Judge) ve izlemeyi (Eval) kullanarak değişkenliği yönetmek.

  5. Ajanlar evrilir, API'ler değil
    • Tuzak: İnsan merkezli API'ler (örtük bağlam) kullanmak, ajan halüsinasyonlarına yol açar.
    • Çözüm: Ayrıntılı semantik tipleme (ör. “user_email_address”) ve docstring'lerle netlik sağlamak. Ajanlar araç değişimlerine uyum sağlayabilir.

Sonuç

Olasısallığı kabul edip bunu Eval ve öz-düzeltme ile yönetmek gerekiyor. “Güven ama doğrula” — katılık yerine esnek sistemler kurmak temel nokta. (Orijinal kaynak: Philipp Schmid'in “Why (Senior) Engineers Struggle to Build AI Agents” yazısı)

Henüz yorum yok.

Henüz yorum yok.