GPT4All - LLaMA tabanlı, 800k komut veri setiyle eğitilmiş sohbet botu
(github.com/nomic-ai)- Asistan tarzı büyük dil modeli
- Toplanan veriler, veri toplama prosedürü, eğitim kodu ve nihai model ağırlıkları dahil her şey açık olarak paylaşılıyor
- GPT 3.5 Turbo ile üretilen 800k veri (kod/hikâye/diyalog) ile eğitildi
- LAION OIG, Stack Overflow'daki kodlama soruları ve Big-Science/P3'ün komut ince ayarı verileri temel veri seti olarak kullanıldı
- Stanford Alpaca gibi çalışmalar referans alındı ve veriler ATLAS'a yüklenerek kürasyon ve temizleme sürecinden geçirildi
Henüz yorum yok.