RouteLLM - LLM yönlendirici sunumu ve değerlendirmesi için çerçeve

(github.com/lm-sys)

3 puan yazan GN⁺ 2024-07-12 | Henüz yorum yok. | WhatsApp'ta paylaş

RouteLLM, LMSys ve Anyscale iş birliğiyle geliştirilen, LLM yönlendirici serving ve değerlendirmesi için bir çerçevedir
Temel özellikler:
- OpenAI istemcisinin yerine geçerek basit sorguları daha ucuz modellere yönlendirme
- Eğitilmiş yönlendiriciler sunma, yeni yönlendiricilerle genişletme ve benchmark'larda yönlendirici performansını karşılaştırma vb.

GPT-4 ve Mixtral 8x7B'nin yanı sıra strong-model ve weak-model argümanları değiştirilerek çeşitli model kombinasyonları kullanılabilir
LiteLLM kullanılarak çeşitli açık kaynak ve kapalı modellerde chat completions desteği sunulur
OpenAI uyumlu endpoint'ler de kullanılabilir
Farklı model sağlayıcıları için API anahtarlarının nasıl ayarlanacağı açıklanır

Geliştirme motivasyonu

Maliyet ve yetenekleri farklı LLM'leri dağıtırken, yüksek kaliteli yanıtlar için en güçlü modeli kullanmak pahalı olabilir; ucuz modelleri kullanmak ise kaliteyi düşürebilir
LLM yönlendirme, basit sorguları daha ucuz modellere göndererek kaliteyi korurken maliyeti azaltan bir çözüm sunar
Her isteğin, maliyet-kalite dengesini belirleyen bir cost threshold değeri vardır

RouteLLM, çeşitli yönlendirme stratejilerine göre istekleri yönlendirmek için hafif bir OpenAI uyumlu sunucu sağlar
--routers ile kullanılabilir yönlendiricilerin listesi, --config ile yönlendirici yapılandırma dosyasının yolu belirtilir
Çoğu durumda güçlü ve hafif mf yönlendiricisinin kullanılması önerilir
İstemci, model alanında yönlendirici adı ve threshold belirterek istek gönderir

Yönlendirmede kullanılan threshold, maliyet-kalite dengesini kontrol eder
Anlamlı threshold aralığı yönlendirici türüne ve alınan sorgulara göre değiştiğinden, örnek sorgular ve güçlü modele gönderilecek sorgu oranı kullanılarak kalibrasyon yapılması önerilir
Varsayılan olarak Chatbot Arena veri kümesine dayalı threshold kalibrasyonu desteklenir
Gerçekte alınan sorgu türlerine benzer bir veri kümesiyle kalibrasyon yapılması önerilir

RouteLLM, benchmark'larda çeşitli yönlendirme stratejilerinin performansını ölçmek için bir değerlendirme çerçevesi de içerir
--routers ile değerlendirilecek yönlendirici listesi, --benchmark ile değerlendirilecek belirli benchmark belirtilir
Değerlendirme sonuçları konsola yazdırılır ve ayrıca yönlendirici performans grafikleri oluşturulur
Varsayılan olarak değerlendirmede kullanılan model çifti GPT-4 ve Mixtral'dır; --strong-model ve --weak-model bayraklarıyla değiştirilebilir

RouteLLM, gpt-4-1106-preview ve mixtral-8x7b-instruct-v0.1 model çifti için eğitilmiş 4 yönlendirici sunar
Yönlendirici listesi: mf, sw_ranking, bert, causal_llm, random
Bu yönlendiriciler başka güçlü/zayıf model çiftlerine de iyi genellenir; bu nedenle model çifti değiştirilse bile yeniden eğitim gerekmez

RouteLLM, farklı LLM'leri verimli kullanmayı sağlayan faydalı bir çerçeve gibi görünüyor. Özellikle basit sorguları daha ucuz modellere yönlendirerek kaliteyi korurken maliyeti azaltabilmesi dikkat çekici
Sunulan yönlendiricilerin çeşitli model çiftlerine iyi genellenmesi de olumlu. Kullanıcının yönlendiricileri kendisinin eğitmek zorunda olmaması bir avantaj
Threshold kalibrasyonu özelliği de faydalı görünüyor. Kullanıcının gerçek sorgu verilerini kullanarak en uygun threshold bulunabilir
Değerlendirme çerçevesi sayesinde farklı yönlendiricilerin ve benchmark'ların performansı kolayca karşılaştırılabilir
Ancak çerçeveyi kullanmak için güçlü ve zayıf modellere ait API anahtarlarının ayarlanması gibi ön hazırlıklar gerekiyor. Bu da yeni başlayanlar için belirli bir giriş eşiği oluşturabilir
Benzer işlevler sunan başka bir proje olarak Multi-model adlı açık kaynak proje bulunuyor. Birden çok dil modelini tek bir API altında birleştirme ve yönlendirme işlevleri sunuyor