Replit Code - 10 Günde Eğitilmiş Açık Kaynak Kod Üretim LLM'i
(huggingface.co)- Replit, ticari kullanıma uygun açık kaynaklı yeni bir kod üretim LLM'ini yayınladı.
- 2.7B parametreyle hafif ve hızlı; eğitim yalnızca 10 günde tamamlandı.
- Aynı sınıftaki modellere kıyasla %40 performans artışı sağlıyor; fine-tune edilmiş model ise Codex'ten daha iyi performans gösteriyor.
- The Stack veri kümesiyle eğitildi ve 20'den fazla dil üretebiliyor.
- Demo, Hugging Face üzerinde doğrudan kullanılabiliyor.
2 yorum
Son zamanlarda ticari kullanıma açık açık kaynaklı LLM’lerin epey arttığı hissine kapılıyorum. Acaba LLaMA’dan mı etkilendiler...
Ayrıca model boyutuna kıyasla performansın oldukça iyileşmiş olması hoşuma gidiyor.
Bu seviyedeyse, sıradan bir (GPU’suz) geliştirme bilgisayarında yerel olarak çalıştırılabilecek düzeyde olabilir diye düşünüyorum.