DeepSpeed Chat - RLHF kullanarak ChatGPT benzeri modeller eğitmek için çerçeve
(github.com/microsoft)- Hızlı, düşük maliyetli ve ölçeklenebilir açık sistem çerçevesi
- Uçtan uca RLHF (Reinforcement Learning Human Feedback) ile her ölçekte yüksek kaliteli ChatGPT tarzı modeller oluşturabilir
- Tek tıkla, 48GB belleğe sahip tek bir NVIDIA A6000 GPU üzerinde 1,3B parametreli bir ChatGPT modelini 1,36 saat içinde eğitmek, üretmek ve servis etmek mümkün
- Databricks Dolly, CarperAI-TRLX, Huggingface-PEFT tarafından kullanılıyor
1 yorum
DeepSpeed - MS'nin duyurduğu derin öğrenme optimizasyon kütüphanesi
Databricks, ChatGPT'ye benzer Dolly 2.0'ı açık kaynak olarak yayımladı