LLaMA-Adapter V2: LLaMA'yı verimli şekilde fine-tune etmek için bir araç
(github.com/ZrrSkywalker)- Yalnızca 1,2 milyon eğitilebilir parametreyle, LLaMA 1 saat içinde Instruction-Following ve MultiModal bir model olarak eğitilebiliyor
- Alpaca için 7B parametre, 13G depolama alanı ve 3 saat gerekirken,
LLaMA-Adapter için 1,2M parametre, 4,7M depolama alanı ve 1 saat yeterli
1 yorum
LoRA'ya benzer bir PEFT yöntemi kullanılmış ve her şeyden önce Visual Context desteği sunması asıl önemli nokta değil mi? LLaMA'nın PEFT yaklaşımındaki SFT (Instruction Fine Tune) zaten fazlasıyla var da...