19 puan yazan kuroneko 2023-05-04 | 2 yorum | WhatsApp'ta paylaş
  • Replit, ticari kullanıma uygun açık kaynaklı yeni bir kod üretim LLM'ini yayınladı.
  • 2.7B parametreyle hafif ve hızlı; eğitim yalnızca 10 günde tamamlandı.
  • Aynı sınıftaki modellere kıyasla %40 performans artışı sağlıyor; fine-tune edilmiş model ise Codex'ten daha iyi performans gösteriyor.
  • The Stack veri kümesiyle eğitildi ve 20'den fazla dil üretebiliyor.
  • Demo, Hugging Face üzerinde doğrudan kullanılabiliyor.

2 yorum

 
kuroneko 2023-05-04

Son zamanlarda ticari kullanıma açık açık kaynaklı LLM’lerin epey arttığı hissine kapılıyorum. Acaba LLaMA’dan mı etkilendiler...

Ayrıca model boyutuna kıyasla performansın oldukça iyileşmiş olması hoşuma gidiyor.
Bu seviyedeyse, sıradan bir (GPU’suz) geliştirme bilgisayarında yerel olarak çalıştırılabilecek düzeyde olabilir diye düşünüyorum.