- Şu ana kadarki en güçlü dil modeli
- 7.3B parametreli model; tüm benchmark’larda Llama 2 13B’yi, birçok benchmark’ta ise Llama 1 34B’yi geride bırakıyor
- Daha hızlı çıkarım için Grouped-query attention (GQA) ve daha düşük maliyetle daha uzun dizileri işlemek için Sliding Window Attention (SWA) kullanıyor
- Apache 2.0 lisansı ile herhangi bir kısıtlama olmadan kullanılabiliyor
- Herhangi bir bulutta (AWS/GCP/Azure) vLLM çıkarım sunucusu ve skypilot kullanılarak dağıtılabiliyor; ayrıca HuggingFace üzerinde de kullanılabiliyor
- Kolayca ince ayar yapılabiliyor ve sohbet için ince ayar yapılmış modeli, Llama 2 13B Chat’i geride bırakıyor
1 yorum
Hacker News görüşleri