LLaMA-Adapter V2: LLaMA'yı verimli şekilde fine-tune etmek için bir araç

xguru · 2023-05-03T10:18:01+09:00

Yalnızca 1,2 milyon eğitilebilir parametreyle, LLaMA 1 saat içinde Instruction-Following ve MultiModal bir model olarak eğitilebiliyor Alpaca için 7B parametre, 13G depolama alanı ve 3 saat gerekirken, LLaMA-Adapter için 1,2M parametre, 4,7M depolama alanı ve 1 saat yeterli

(github.com/ZrrSkywalker)

7 puan yazan xguru 2023-05-03 | 1 yorum | WhatsApp'ta paylaş

Yalnızca 1,2 milyon eğitilebilir parametreyle, LLaMA 1 saat içinde Instruction-Following ve MultiModal bir model olarak eğitilebiliyor
Alpaca için 7B parametre, 13G depolama alanı ve 3 saat gerekirken,
LLaMA-Adapter için 1,2M parametre, 4,7M depolama alanı ve 1 saat yeterli

1 yorum

bytebrawlers 2023-05-03

LoRA'ya benzer bir PEFT yöntemi kullanılmış ve her şeyden önce Visual Context desteği sunması asıl önemli nokta değil mi? LLaMA'nın PEFT yaklaşımındaki SFT (Instruction Fine Tune) zaten fazlasıyla var da...

LLaMA-Adapter V2: LLaMA'yı verimli şekilde fine-tune etmek için bir araç

İlgili okumalar

1 yorum