- Yapay zeka programlama yardımcısı Sketch'in geliştirme deneyimi üzerinden, LLM ile araç kullanımını birleştiren döngü yapısının ne kadar yalın uygulanabildiği vurgulanıyor
- Yalnızca 9 satırlık bir döngü koduyla Claude 3.7 Sonnet gibi modern LLM'ler gerçek sorunları hızla çözüyor
- bash gibi tek bir genel amaçlı araç bile geliştiricilerin tekrar eden ve zahmetli işlerinin önemli bir kısmını otomatikleştirebiliyor
- Sorun çözmenin ötesinde, ek araçlar bağlanarak metin düzenleme veya özelleşmiş işler için kalite ve yineleme hızı artırılabiliyor
- Giderek daha fazla özelleştirilmiş LLM ajan döngüsü, geliştiricilerin günlük otomasyonuna dahil ediliyor
Giriş: geliştirme deneyimi ve Sketch projesi
- Philip Zelikiger ve çalışma arkadaşları, yapay zeka tabanlı programlama yardım aracı Sketch'i geliştirirken, LLM ile araç kullanımını birleştiren basit bir ajan döngüsü yapısının yüksek verimliliği karşısında şaşkınlık duydu
- Temel yapı yalnızca 9 satırlık bir döngü kodundan oluşuyor ve sistem prompt'unu, konuşma geçmişini ve en güncel mesajı LLM API'sine iletiyor
- LLM çıktı üretiyor ve gerekirse tool_calls (araç çağrısı isteği) döndürüyor
LLM ve araç kullanımının entegrasyonu
- "Araç kullanımı (tool use)", LLM'in önceden tanımlı şemaya uygun çıktılar döndürmesi anlamına geliyor; sistem prompt'u ve araç açıklama prompt'ları sayesinde LLM'in
bash gibi genel amaçlı araçlara erişmesi sağlanıyor
- Modern LLM'ler (ör. Claude 3.7 Sonnet), tek bir genel amaçlı araçla bile çeşitli sorunları hızla otomatikleştiriyor; bazıları tek çalıştırmada ("one shot") bile çözülebiliyor
- Eskiden karmaşık
git komutlarını arayıp yapıştırmak ve birleştirme işlemlerini elle yapmak gerekirken, artık Sketch'ten isteyip sorunu doğrudan çözdürmek mümkün
- Tür değişikliklerinden sonra oluşan çok sayıdaki type check hatasını da Sketch ilk kez otomatik olarak ele alabildi
- Ajan döngüsü sürekli ve uyarlanabilir çalışıyor; araç kurulu değilse otomatik kurulum yapabiliyor ve komut seçeneklerindeki farklılıklara göre kendini uyarlayabiliyor
- Kullanım sırasında LLM bazen testler başarısız olduğunda "testi atla" gibi beklenmedik öneriler sunsa da, genel olarak iş otomasyonunun kalitesi artıyor
Araçların çeşitlenmesi ve özelleşmesi
- Sketch,
bash dışında ek araçlar da kullanıldığında (bkz. metin düzenleme araçları), iş kalitesinin arttığını ve geliştirme iş akışının daha da verimli hale geldiğini deneyimledi
- LLM'in
sed vb. araçlarla metni tam isabetle düzenlemesi beklenenden daha zor; görsel (visual) editör tarzı araçların daha iyi olduğu görülüyor
Gelecek görünümü ve iş akışı değişimi
- Ajan döngüsü yapısının, mevcut genel amaçlı otomasyon araçlarıyla ele alınması zor olan geliştirici günlüklerindeki tekrar eden işler için giderek daha fazla kullanılacağı öngörülüyor
- Örneğin stack trace ile git commit korelasyonunu analiz etmek gibi zahmetli ve tekrarlı işlerde, LLM hızlı bir ilk işleme katmanı sağlayabiliyor
- Gelecekte daha fazla özelleştirilmiş, tek seferlik LLM ajan döngüsünün geliştiricilerin bin/ dizini gibi yerlerde kullanılmasını beklemek mümkün
- Kullanıcılar yalnızca gerekli bearer token'ı hazırlayarak kendi ortamlarında kolayca denemeler yapabiliyor
İlgili bağlantılar
1 yorum
Hacker News görüşleri
?utm_source=hn&utm_medium=browsereklemem gerekip gerekmediğini düşündüm