- Araştırma ve ticari kullanımın ikisi için de kullanılabilen açık kaynaklı büyük dil modeli
- Llama 1'e kıyasla %40 daha fazla, 2 trilyon token verisiyle eğitildi
- 2 kat bağlam uzunluğu: 4096
- Üç model boyutu: 7B, 13B, 70B
- Çıkarım, kodlama, yeterlilik ve bilgi testleri gibi birçok benchmark'ta diğer açık kaynak dil modellerinden daha iyi performans (MPT, Falcon, Llama-1)
- Açık veri kaynaklarıyla eğitildi; ayrıca ince ayar yapılmış Llama-2-chat de açık komut veri setleri ve bir milyondan fazla insan anotasyonunu kullanıyor
- Reinforcement Learning from Human Feedback (RLHF) kullanıldı. Rejection Sampling ve Proximal Policy Optimization (PPO) dahil
- İndirmeye dahil olanlar
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1 yorum
Hacker News yorumları