19 puan yazan xguru 2023-03-31 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Asistan tarzı büyük dil modeli
  • Toplanan veriler, veri toplama prosedürü, eğitim kodu ve nihai model ağırlıkları dahil her şey açık olarak paylaşılıyor
  • GPT 3.5 Turbo ile üretilen 800k veri (kod/hikâye/diyalog) ile eğitildi
    • LAION OIG, Stack Overflow'daki kodlama soruları ve Big-Science/P3'ün komut ince ayarı verileri temel veri seti olarak kullanıldı
    • Stanford Alpaca gibi çalışmalar referans alındı ve veriler ATLAS'a yüklenerek kürasyon ve temizleme sürecinden geçirildi

Henüz yorum yok.

Henüz yorum yok.