Yapay zeka ajanlarının benimsenmesindeki en büyük darboğaz performans değil, güvendir (feat. zaman).

(maily.so)

4 puan yazan haebom 2026-03-08 | 1 yorum | WhatsApp'ta paylaş

Yapay zeka ajanları gerçekte ne kadar otonom çalışıyor?

Anthropic, milyonlarca Claude Code etkileşimini analiz ederek yapay zeka ajanlarına gerçekte ne kadar iş devredildiğini ölçtü.
Araştırmanın odağı model performansı değil, insanların ne kadar otonomi devrettiği oldu.
Çoğu görev kısa sürse de, en uzun otonom çalışma süresi 3 ay içinde 25 dakikadan 45 dakikanın üzerine çıktı.
İlginç olan, bu değişimin model yükseltmelerinden çok kullanıcı güveninin birikmesinden kaynaklanması.
Deneyimli kullanıcılar, otomatik onay oranını artırırken aynı zamanda gerektiğinde araya girilen bir ‘izleme yöntemiyle’ denetim stratejilerini değiştiriyor.
Ayrıca yapay zeka da belirsiz olduğunda soru sormak veya durmak gibi öz denetim mekanizmaları sergiliyor.
Şu anda ajan kullanımının yarısı yazılım geliştirme alanında yoğunlaşıyor.
Sonuçta yapay zeka ajanlarının otonomisi, model performansından çok güven, kurum kültürü ve araç yapısı tarafından belirleniyor.

armila 2026-03-09

Bir dakika!<ctrl+ enter>