Çoğunlukla Claude kullanarak çeşitli ajanlar oluşturup iş akışları kurarak tasarım, geliştirme ve testi otomatik olarak yaptıklarını söylüyorlar. Bu tür yöntemlerle ilgili çok yazı var ama pratikte gerçekten nasıl çalıştığını merak ediyorum. Tasarım, geliştirme, test vb. için farklı modeller kullanıp hangi modelin hangi işe uygun olduğuna dair de birçok yazı var.
Şu anda Cursor denen şeyi kullanıyorum; bahsedilen tüm işleri model otomatik olarak kurup bununla tek başına yapıyor gibi görünüyor, ancak yine de sürekli izleyip konuşarak yön vermek gerekiyor. Claude'u yukarıda bahsedilen şekilde kullanırsak bunun tamamen otomatik olup olmadığını merak ediyorum. Benim deneyimime göre proje büyüdükçe sürekli yön vermediğinizde iş alakasız ya da yetersiz hale geliyor; bu yüzden "tam otomatik" yöntemi ayrıntılı biçimde anlatan yazılar ya da videolar var mı? Bu tür yazı veya videolara baktığımda, adım adım uygulanabilecek kadar ayrıntılı yöntemler göremedim.
4 yorum
Tam, uçtan uca otomasyonu hedeflemektense, işi parçalara ayırıp her parçanın sorumlusunu tanımlamanın en azından daha gerçekçi bir strateji olduğunu düşünüyorum. Örüntü tanıma, anlam çıkarma ve genel bilgiyle ilişkilendirme gibi işleri LLM'e bırakıp; anlam yükleme, bağlam ekleme ve karar vermeyi insanın yapması buna bir örnek. Bunu kodlama senaryosuna uygularsak, tekrarlayan kod üretimi ya da test senaryosu yazımını LLM'e devredip; mimari kararlar ve alan modeli oluşturmayı insanın yapması uygun olur. Böylece sorun, karar vermeyi ne ölçüde otomatikleştirebileceğimiz noktasına daralır ve biraz daha somut örnekleri daha kolay bulabileceğinizi düşünüyorum.
Yanıtınız için teşekkürler. Orijinal gönderide de belirttiğim gibi, bu tür yazılar dikkatimi çekti ancak somut yöntemler ele alınmadığı için, acaba iyi bilinen bir belge ya da bilgi var mı diye merak ettim.
Ekonomiden mi bilmiyorum ama son zamanlarda AI agent ile her şeyi çözebilecekmişiz gibi anlatan yazılar ve eğitimler çok arttı; ancak hâlâ yalnızca yapay zeka ile her şeyi %100 seviyesinde yapmak gerçekçi olarak zor. Alana göre bunun en fazla %70-80 civarında olduğunu düşünüyorum ve bunun ötesine geçmek için o alanın uzmanının şart olduğuna inanıyorum.
"Tam otomatik" yaklaşımına dair bir yazı ya da video henüz görmedim,
ama bununla ilgili tartışmaların ve deneylerin belli çevrelerde yürütüldüğü anlaşılıyor.
Aşağıdaki makalelerin, yazarın sorusuna dair ipuçları olacağını düşünüyorum!
https://anthropic.com/engineering/…
https://openai.com/ko-KR/index/harness-engineering/
https://github.com/karpathy/autoresearch
https://www.minimax.io/news/minimax-m27-en