1 puan yazan GN⁺ 2025-02-22 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Sky-T1

  • O1 Preview modelini 450 dolara eğitmek

    • O1 ve Gemini 2.0 gibi modeller, karmaşık görevleri çözmede üstün muhakeme yeteneği gösteriyor ve bunu uzun içsel düşünme süreçleriyle gerçekleştiriyor.
    • Ancak teknik ayrıntılara ve model ağırlıklarına erişilememesi, akademi ve açık kaynak topluluğunun katılımı için bir engel oluşturuyor.
    • Buna yanıt olarak, Still-2 ve Journey gibi matematik alanındaki açık ağırlıklı muhakeme modellerini eğitmeyi amaçlayan dikkat çekici bazı çalışmalar ortaya çıktı.
    • UC Berkeley'deki NovaSky ekibi, temel ve instruction-tuned modellerin muhakeme yeteneklerini geliştirmek için çeşitli teknikleri araştırıyor.
    • Bu araştırmada, yalnızca matematikte değil, kodlamada da aynı model üzerinde rekabetçi muhakeme performansı elde ediliyor.
  • Katkıda bulunanlar

    • Dacheng Li, Shiyi Cao, Shu Liu, Tyler Griggs, Simon Mo, Shishir G. Patil, Joseph E. Gonzalez, Ion Stoica

Henüz yorum yok.

Henüz yorum yok.