Microsoft LLMLingua - Çıkarımı hızlandırmak ve maliyeti azaltmak için prompt sıkıştırma

xguru · 2023-12-22T10:02:02+09:00

GPT2-small veya LLaMA-7B gibi hizalanmış ve iyi eğitilmiş küçük dil modelleri sıkıştırma için kullanılıyor Prompt içindeki önemsiz token’ları tespit ederek black-box LLM üzerinde sıkıştırılmış prompt ile çıkarım yapılmasını sağlıyor LLM’in çıkarım hızını artırmak ve temel bilgilere yönelik farkındalığını iyileştirmek için prompt ve KV-Cache sıkıştırılıyor Performans kaybını en aza indirirken 20 kata kadar sıkıştırma sağlanıyor Prompt ve üretilen bağlamı azaltarak maliyeti düşürüyor Prompt içindeki önemli bilgi yoğunluğunu artırarak daha uzun bağlam desteği sunabiliyor

(github.com/microsoft)

10 puan yazan xguru 2023-12-22 | Henüz yorum yok. | WhatsApp'ta paylaş

GPT2-small veya LLaMA-7B gibi hizalanmış ve iyi eğitilmiş küçük dil modelleri sıkıştırma için kullanılıyor
Prompt içindeki önemsiz token’ları tespit ederek black-box LLM üzerinde sıkıştırılmış prompt ile çıkarım yapılmasını sağlıyor
- LLM’in çıkarım hızını artırmak ve temel bilgilere yönelik farkındalığını iyileştirmek için prompt ve KV-Cache sıkıştırılıyor
- Performans kaybını en aza indirirken 20 kata kadar sıkıştırma sağlanıyor
Prompt ve üretilen bağlamı azaltarak maliyeti düşürüyor
Prompt içindeki önemli bilgi yoğunluğunu artırarak daha uzun bağlam desteği sunabiliyor

Microsoft LLMLingua - Çıkarımı hızlandırmak ve maliyeti azaltmak için prompt sıkıştırma

İlgili okumalar

Henüz yorum yok.