4 puan yazan frida 2024-07-01 | 2 yorum | WhatsApp'ta paylaş

2 yorum

 
frida 2024-07-02

Daha uzun bağlam penceresine sahip bir Korece LLM kullanmak amacıyla, LLM’in bağlam uzunluğunu verimli biçimde artırmak için araştırıp denediğim çeşitli yöntemler

  1. LongLoRA
    shifted sparse attention ve LoRA fine-tuning kullanarak 8 kata kadar genişletme

  2. RoPE tabanlı Position Interpolation
    Llama gibi RoPE tabanlı embedding kullanan modellere, RoPE embedding’i değiştirilerek uygulanabilir ve fine-tuning ile bağlam uzunluğu 16 kata kadar genişletilebilir

  3. Dynamic NTK
    fine-tuning olmadan NTK teorisini uygulayarak 2 katın üzerinde genişletme

  4. LongLM
    değiştirilmiş attention kullanarak fine-tuning olmadan 4 kata kadar genişletme

  5. ChunkLlama
    metni chunk’lara bölerek fine-tuning olmadan Llama modelinin bağlam uzunluğunu 4 kata çıkarma

  6. Infini-attention
    az ek bellek kullanımıyla 2M’e kadar uzatılabilir ve hızlı çıkarım mümkündür; Gemini-Pro’da uygulanan yöntem

 
superwoou 2024-07-02

Bu kadar da özetsiz bir yazıyı ilk kez görüyorum.