ColossalChat - ChatGPT'yi klonlamak için RLHF hattına yönelik açık kaynak çözüm

xguru · 2023-03-31T11:32:02+09:00

LLaMA modeli temel alınarak Supervised veri toplama Supervised fine-tuning Reward modeli eğitimi Reinforcement Learning fine-tuning İçerdiği bileşenler Çevrim içi çalışan interaktif demo 7B/13B modellerini içeren tam RLHF eğitim kodunun açık kaynak sürümü Çince/İngilizce’den oluşan 104k iki dilli veri seti 7B modelin 4-bit quantization'ı. Yalnızca 4GB GPU belleği gerekiyor Model ağırlıkları dahil. Tek sunucuda kolayca yeniden üretilebilir Büyük modeller/veri setleri/optimizasyonlar vb. de eklenmeye devam edecek

(medium.com/@yangyou_berkeley)

10 puan yazan xguru 2023-03-31 | Henüz yorum yok. | WhatsApp'ta paylaş

LLaMA modeli temel alınarak
- Supervised veri toplama
- Supervised fine-tuning
- Reward modeli eğitimi
- Reinforcement Learning fine-tuning
İçerdiği bileşenler
- Çevrim içi çalışan interaktif demo
- 7B/13B modellerini içeren tam RLHF eğitim kodunun açık kaynak sürümü
- Çince/İngilizce’den oluşan 104k iki dilli veri seti
- 7B modelin 4-bit quantization'ı. Yalnızca 4GB GPU belleği gerekiyor
- Model ağırlıkları dahil. Tek sunucuda kolayca yeniden üretilebilir
- Büyük modeller/veri setleri/optimizasyonlar vb. de eklenmeye devam edecek

ColossalChat - ChatGPT'yi klonlamak için RLHF hattına yönelik açık kaynak çözüm

İlgili okumalar

Henüz yorum yok.