Yapay zeka ajanları gerçekte ne kadar otonom çalışıyor?
- Anthropic, milyonlarca Claude Code etkileşimini analiz ederek yapay zeka ajanlarına gerçekte ne kadar iş devredildiğini ölçtü.
- Araştırmanın odağı model performansı değil, insanların ne kadar otonomi devrettiği oldu.
- Çoğu görev kısa sürse de, en uzun otonom çalışma süresi 3 ay içinde 25 dakikadan 45 dakikanın üzerine çıktı.
- İlginç olan, bu değişimin model yükseltmelerinden çok kullanıcı güveninin birikmesinden kaynaklanması.
- Deneyimli kullanıcılar, otomatik onay oranını artırırken aynı zamanda gerektiğinde araya girilen bir ‘izleme yöntemiyle’ denetim stratejilerini değiştiriyor.
- Ayrıca yapay zeka da belirsiz olduğunda soru sormak veya durmak gibi öz denetim mekanizmaları sergiliyor.
- Şu anda ajan kullanımının yarısı yazılım geliştirme alanında yoğunlaşıyor.
- Sonuçta yapay zeka ajanlarının otonomisi, model performansından çok güven, kurum kültürü ve araç yapısı tarafından belirleniyor.
1 yorum
Bir dakika!<ctrl+ enter>