- 3B/7B modelleri yayımlandı; 15B/30B/65B modellerinin de yayımlanması planlanıyor ve 175B'ye kadar hedefleniyor
- Model, CC BY-SA-4.0 lisansı altında ve kaynak belirtildiğinde ticari kullanım mümkün
- Açık veri kümesi The Pile temel alındı, ancak bunun 3 katı büyüklüğünde 1.5T token içeren yeni bir veri kümesiyle eğitildi
- Bağlam uzunluğu 4096 token
- PoC olarak, Alpaca prosedürü izlenerek fine-tuning yapılan StableLM-Tuned-Alpha-7B modeli de yayımlandı
- 5 etkileşimli veri kümesi kullanıldı: Stanford's Alpaca, Nomic-AI's gpt4all, RyokoAI's ShareGPT52K datasets, Databricks labs' Dolly, Anthropic's HH
- Sohbet botu demosu Hugging Face'te yayımlandı
2 yorum
Harika harika!
Stable Diffusion'ın yayımlanmasının piyasayı hızlandırması gibi, dil modelleri için de artık herkesin kullanabileceği veri ve kullanım örnekleri akın akın gelecek gibi görünüyor.