10 puan yazan ninebow 2023-10-03 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Meta, Effective Long-Context Scaling of Foundation Models başlıklı makaleyle LLaMA2 Long modelini duyurdu
  • Bağlam penceresi (context window) uzunluğu 32K (32.768) token'a kadar destekleniyor
  • 70B sürümü, uzun bağlam görevleri koleksiyonunda şimdiden gpt-3.5-turbo-16k'nin genel performansını aşıyor
  • Mevcut model mimarisi korunurken, konumsal kodlamada (Positional Encoding) RoPE (Rotary Positional Embedding) uygulanarak daha az bilgiyle daha iyi yanıtlar üretiliyor

Henüz yorum yok.

Henüz yorum yok.