14 puan yazan xguru 2023-05-09 | 2 yorum | WhatsApp'ta paylaş
  • 1 trilyon token ile eğitilmiş bir transformer
  • LLaMA-7B ile benzer kalitede, ancak açık kaynaklı ve ticari kullanıma uygun
  • Ek olarak 3 ince ayar modeli de yayımlandı
    • MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (65K token desteği)
  • MosaicML platformunda 9,5 günde yaklaşık ~$200K maliyetle eğitildi; ayrıca kendi MPT modelinizi eğitmeniz, ince ayar yapmanız ve dağıtmanız mümkün
  • MPT: Mosaic Pretrained Transformers

2 yorum

 
kuroneko 2023-05-09

Bu sıralar ticari kullanıma uygun açık kaynak LLM modellerinin inanılmaz hızla piyasaya sürüldüğünü görünce
LLM dünyasının Stable Diffusion'ı olmak için yarışıyorlarmış gibi geliyor.

Kazananın kim olacağını merakla bekliyorum. +_+

 
xguru 2023-05-09

Bence önce ChatGPT ile entegrasyon kurup geliştirme yapmak, ardından daha sonra en gelişmiş açık kaynak seçeneğiyle değiştirmek iyi bir alternatif gibi görünüyor.