12 puan yazan xguru 4 일 전 | 1 yorum | WhatsApp'ta paylaş
  • SWE-bench ve SWE-agent'ı geliştiren Princeton·Stanford ekibi tarafından geliştirilen minimalist bir yapay zeka kodlama ajanı
  • Yaklaşık 100 satır Python kodundan oluşan son derece hafif bir yapay zeka yazılım mühendisliği ajanı; büyük yapılandırma dosyaları veya monorepo olmadan çalışıyor
  • Araç olarak yalnızca bash kullanıyor ve LLM'nin tool-calling arayüzü olmadan da herhangi bir modelle uyumlu
  • SWE-bench verified kıyaslamasında %74'ün üzerinde başarı elde etti; Gemini 3 Pro ile de aynı seviyeyi kaydetti
  • Her aksiyonu subprocess.run ile bağımsız olarak çalıştırdığı için durum koruyan bir shell oturumuna ihtiyaç duymuyor; Docker'a geçerken docker exec ile değiştirmek yeterli olacak kadar basit
  • Tamamen doğrusal geçmiş yapısı sayesinde trajektori ile LLM'ye iletilen mesajlar aynı; hata ayıklama ve fine-tuning için ideal
  • Local, Docker/Podman, Singularity/Apptainer, Bubblewrap, Contree gibi çeşitli sandbox ortamlarında dağıtımı destekliyor
  • litellm, openrouter, portkey vb. üzerinden tüm modelleri destekliyor; /completion ve /response endpoint'leri ile interleaved thinking uyumlu
  • Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale, Princeton·Stanford gibi kurumlarda kullanılıyor
  • Claude Code'a kıyasla çok daha hızlı başlıyor ve ajan scaffold'una aşırı uyum olmadan LLM'nin kendi performansını değerlendirmek için bir baseline olarak kullanılabiliyor
  • CLI(mini), batch inference, trajektori tarayıcısı, Python binding'leri (DefaultAgent, LitellmModel, LocalEnvironment) sunuyor
  • MIT lisansı

1 yorum

 
ragingwind 3 일 전

Artık doğrudan ajan geliştirmek kolaylaşıyor.