7 puan yazan xguru 2023-05-03 | 1 yorum | WhatsApp'ta paylaş
  • Yalnızca 1,2 milyon eğitilebilir parametreyle, LLaMA 1 saat içinde Instruction-Following ve MultiModal bir model olarak eğitilebiliyor
  • Alpaca için 7B parametre, 13G depolama alanı ve 3 saat gerekirken,
    LLaMA-Adapter için 1,2M parametre, 4,7M depolama alanı ve 1 saat yeterli

1 yorum

 
bytebrawlers 2023-05-03

LoRA'ya benzer bir PEFT yöntemi kullanılmış ve her şeyden önce Visual Context desteği sunması asıl önemli nokta değil mi? LLaMA'nın PEFT yaklaşımındaki SFT (Instruction Fine Tune) zaten fazlasıyla var da...