SlowLlama - Llama2-70b ve CodeLLama'yı M1/M2 üzerinde kuantizasyon olmadan fine-tune etme

xguru · 2023-10-09T10:32:01+09:00

Apple M1/M2 ve tüketici sınıfı nVidia GPU'larda LLama2-70B gibi modelleri fine-tune etme Kuantizasyon kullanmak yerine, hem forward hem de backward pass sırasında modelin bir kısmını SSD'ye veya ana belleğe offload etme yaklaşımı Mevcut sürüm, güncellemeleri daha küçük bir parametre setiyle sınırlamak için LoRA kullanıyor İlk sürümde tam fine-tune da mümkündü, ancak artık kaldırıldı

(github.com/okuvshynov)

9 puan yazan xguru 2023-10-09 | Henüz yorum yok. | WhatsApp'ta paylaş

Apple M1/M2 ve tüketici sınıfı nVidia GPU'larda LLama2-70B gibi modelleri fine-tune etme
Kuantizasyon kullanmak yerine, hem forward hem de backward pass sırasında modelin bir kısmını SSD'ye veya ana belleğe offload etme yaklaşımı
Mevcut sürüm, güncellemeleri daha küçük bir parametre setiyle sınırlamak için LoRA kullanıyor
- İlk sürümde tam fine-tune da mümkündü, ancak artık kaldırıldı

SlowLlama - Llama2-70b ve CodeLLama'yı M1/M2 üzerinde kuantizasyon olmadan fine-tune etme

İlgili okumalar

Henüz yorum yok.