50 puan yazan GN⁺ 2026-03-08 | 3 yorum | WhatsApp'ta paylaş
  • nanochat’in LLM eğitim çekirdeğini tek GPU·tek dosyada yaklaşık 630 satıra sıkıştıran kendi kendine yeten otonom araştırma çerçevesi; burada AI ajanı gece boyunca otonom biçimde LLM eğitim deneylerini tekrarlar
  • İnsan promptu düzenler, AI ajanı ise eğitim kodunu düzenlersabit 5 dakikalık zaman bütçesiyle eğitim → sonuçları karşılaştırma → tutma veya atma döngüsünü tekrarlar
  • Ajan, git feature branch üzerinde otonom döngüde çalışır ve sinir ağı mimarisi, optimizer, hiperparametreler gibi alanlarda daha düşük validation loss elde ettikçe eğitim betiğine git commit’leri biriktirir
  • Amaç, insan müdahalesi olmadan en hızlı araştırma ilerlemesini üreten ajanı tasarlamaktır

Proje özeti

  • nanochat’in basitleştirilmiş tek GPU uygulamasını temel alan, AI ajanının eğitim kodunu otonom olarak değiştirip deneyler yaptığı bir yapı
  • Ajan; kodu değiştirme → 5 dakika eğitim → sonucu kontrol etme → tutma/atma döngüsünü tekrarlar, kullanıcı ise sabah deney günlüklerini ve iyileştirilmiş modeli kontrol eder
  • Claude, Codex gibi istenen ajan bu repoya bağlanır, program.md okutulur ve ardından deneyler başlatılır

Temel dosya yapısı (yalnızca 3 dosya önemli)

  • prepare.py - sabitler, veri hazırlama (eğitim verisini indirme, BPE tokenizer eğitimi) ve çalışma zamanı yardımcılarını (data loader, evaluation) içerir; değişiklik hedefi değildir
  • train.py - ajanın düzenlediği tek dosya; tüm GPT modeli, optimizer (Muon + AdamW) ve eğitim döngüsünü içerir; mimari, hiperparametreler, optimizer, batch size gibi tüm unsurlar değiştirilebilir
  • program.md - ajan için temel talimat dosyası; insan tarafından düzenlenir ve ajanın otonom araştırma yönünü belirleyen hafif bir beceri işlevi görür

Tasarım ilkeleri

  • Tek dosya düzenleme: Ajan yalnızca train.py dosyasını değiştirir; böylece değişiklik kapsamı yönetilebilir kalır ve diff incelemesi kolaylaşır
  • Sabit zaman bütçesi: Platformdan bağımsız olarak her zaman tam 5 dakika çalışır → saatte yaklaşık 12, uyku süresince yaklaşık 100 deney mümkün
    • Model boyutu, batch size, mimari gibi değişikliklerden bağımsız olarak deneyler arasında doğrudan karşılaştırma yapılabilir
    • Dezavantaj: Aynı platformda olmayan başka kişilerin çalıştırma sonuçlarıyla karşılaştırılamaz
  • Kendi kendine yeterlilik: PyTorch ve az sayıda paket dışında harici bağımlılık yok; dağıtık eğitim yok; karmaşık kurulum yok

Gereksinimler ve çalıştırma

  • Gereksinimler: tek bir NVIDIA GPU (testler H100 üzerinde yapıldı), Python 3.10+, uv paket yöneticisi
  • Şu anda yalnızca NVIDIA GPU’ları destekler; CPU/MPS gibi diğer platform desteği, kodun gereksiz şişmesini önlemek için şimdilik dahil edilmemiştir
    • Daha geniş platform desteği gerekiyorsa üst nanochat reposuna bakılması önerilir; macOS fork’u (miolini/autoresearch-macos) zaten mevcut
  • Ajanı çalıştırırken repo içinde Claude/Codex vb. çalıştırılır, tüm izinler devre dışı bırakılır, ardından program.md okunup deneylere başlanması için prompt verilir

Varsayılan program.md tasarım amacı

  • Varsayılan program.md, kasıtlı olarak asgari bir baseline olarak tutulur
  • Zaman içinde yinelemeli olarak iyileştirilip, en hızlı araştırma ilerlemesini sağlayan "araştırma organizasyonu kodu"nu bulmak için kullanılabilir
  • Ajan eklemek veya talimatları ayrıntılandırmak için de açıkça genişletilebilir bir yapı sunar

3 yorum

 
tensun 2026-03-08

Lütfen AMD ROCm de ekleyin

 
xguru 2026-03-08

Karpathy’nin tanıtım tweet’i
> Hafta sonu boyunca denemek isteyenler için hazırladım.
> Kod, bilim kurgu ve biraz da delilik karışımı bir iş :)

Hocam, insan hafta sonu neden böyle bir şey yapar ki

 
laeyoung 2026-03-10

Sanırım ders materyallerinin hızla eski kalmaması için hızlıca hazırlayıp EurekaLab dersini çıkarmaya çalışıyor ve üretmeye devam ediyor gibi, hüzünlü.

Not: 7 saat önce AgentHub diye bir tane daha yapıp yüklemiş 🫢