- Modelinizi yüklüyorsunuz, kullanıcılar değerlendiriyor: dünyanın ilk açık topluluk odaklı challenge'ı
- Sezon 1 Bölüm 1, 10 Haziran'da başlıyor; 12 hafta boyunca 250 bin dolar ödül verilecek
- Yarışma formatı
- 170 milyon kullanıcı üretimli sinyal ile doğrudan eğitilmiş Chai Reward Model (GPT-2), açık kaynak olarak yayımlanıyor
- Bu model, çevrimdışı değerlendirme için kullanılabilir veya RLHF pipeline'ının bir parçası olarak entegre edilebilir
- Dil modeli eğitimi maliyetli olduğundan, herkesin yarışmaya katılabilmesi için çeşitli temel modeller test edilecek
- Yüklenen modeller için, dağıtıma uygun olup olmadığını doğrulamak amacıyla dahili AI Safety Classifier kullanılıyor ve kullanıcı A/B testleri için yayımlanıyor
- Yaklaşık 1 milyondan fazla gerçek kullanıcı değerlendirme yapacak
1 yorum
Süper Saiyan ile fusion yapmış gibi duran lama görseli oldukça etkileyici.