nanoGPT - Orta ölçekli GPT'leri en hızlı şekilde eğitmek/ince ayar yapmak için açık kaynak
(github.com/karpathy)- Tesla'nın eski yapay zeka lideri Andrej Karpathy'nin minGPT'yi yeniden yazarak oluşturduğu kod
- Okunması kolay ve sade kod yazmayı hedefliyor
- Yaklaşık 300 satırlık
train.py - Yaklaşık 300 satırlık
model.py
- Yaklaşık 300 satırlık
- OpenWebText veri setinde GPT-2'yi yeniden üretme çalışması sürüyor
Henüz yorum yok.