Lit-LLaMA - nanoGPT tabanlı açık kaynak LLaMA uygulaması
(github.com/Lightning-AI)- GPL lisanslı LLaMA kodu yerine, nanoGPT tabanlı ve Apache 2.0 lisansıyla tamamen ayrı geliştirilmiş bir açık kaynak proje
- Boilerplate olmadan tek dosya halinde uygulanmış; sade yapıda ve mevcut modelle sayısal olarak aynı
- FlashAttention, nicemleme, LoRA fine-tuning ve ön eğitim desteği sunuyor
- Tüketici donanımında çalışacak şekilde optimize edilmiş
1 yorum
nanoGPT, Tesla'nın eski yapay zeka lideri Andrej Karpathy'nin minGPT'yi yeniden yazarak oluşturduğu koddur.
nanoGPT - orta ölçekli GPT'leri en hızlı şekilde eğitmek/ince ayar yapmak için açık kaynak
FlashAttention