Alpaca-LoRA: Düşük Sıralı LLaMA Komut Tuning'i
(github.com/tloen)- Low-Rank Adaptation kullanarak kişisel donanımda LLaMA'yı komut tuning'inden geçirmek
- Raspberry Pi'de çalışabilecek, aynı zamanda
text-davinci-003ile benzer kalitede bir model - Eğitim kodu tek bir RTX 4090 üzerinde 5 saatten kısa sürede çalıştırılabiliyor
- Düşük maliyetli/verimli fine-tuning için Hugging Face'in PEFT (Parameter-Efficient Fine-Tuning) ve Tim Dettmers'in bitsandbytes'ını kullanıyor
Henüz yorum yok.