StarCoder, BigCode projesinin yayınladığı kod için LLM
(huggingface.co)- 80+ programlama dili için 1 trilyon token ile eğitilmiş 15.5B model
- Verimli üretim için MQA kullanır ve 8192 token bağlam penceresine sahiptir
- StarCoderBase : 80'den fazla dil verisi içeren The-Stack v1.2 (6TB) veri kümesiyle eğitildi
- StarCoder : Python üzerinde ek eğitim almış model
- Chat Demo ve VSCode için eklenti sunuluyor
3 yorum
Twitter duyuru gönderisindeki makale bağlantısı burada. :)
https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view
HuggingFace Chat'te doğrudan kullanılabilecek şekilde de yayımlanmış görünüyor. :)
https://huggingface.co/chat/?model=bigcode/starcoder
SantaCoder - 1,1 milyar (1.1B) parametreyle eğitilmiş kod üretim modeli