-
Sky-T1
-
O1 Preview modelini 450 dolara eğitmek
- O1 ve Gemini 2.0 gibi modeller, karmaşık görevleri çözmede üstün muhakeme yeteneği gösteriyor ve bunu uzun içsel düşünme süreçleriyle gerçekleştiriyor.
- Ancak teknik ayrıntılara ve model ağırlıklarına erişilememesi, akademi ve açık kaynak topluluğunun katılımı için bir engel oluşturuyor.
- Buna yanıt olarak, Still-2 ve Journey gibi matematik alanındaki açık ağırlıklı muhakeme modellerini eğitmeyi amaçlayan dikkat çekici bazı çalışmalar ortaya çıktı.
- UC Berkeley'deki NovaSky ekibi, temel ve instruction-tuned modellerin muhakeme yeteneklerini geliştirmek için çeşitli teknikleri araştırıyor.
- Bu araştırmada, yalnızca matematikte değil, kodlamada da aynı model üzerinde rekabetçi muhakeme performansı elde ediliyor.
-
Katkıda bulunanlar
- Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica
Henüz yorum yok.