8 puan yazan xguru 2024-04-30 | 1 yorum | WhatsApp'ta paylaş
  • Yeni model desteği
    • Llama 3: Meta'nın yeni modeli ve şimdiye kadarki en yüksek performanslı açık LLM
    • Phi 3 Mini: Microsoft'un 3,8 milyar parametreli yeni hafif açık modeli
    • Moondream: uç cihazlarda verimli çalışacak şekilde tasarlanmış küçük bir görsel-dil modeli
    • Dolphin Llama 3: Eric Hartford tarafından Llama 3 tabanlı olarak eğitilen sansürsüz model. Çeşitli eğitim, sohbet ve kodlama becerileri içeriyor
    • Qwen 110B: değerlendirmelerde üstün performans gösteren 100B parametre boyutunda model (Alibaba)
  • Hata düzeltmeleri
    • Modelin sonlanmaması nedeniyle API'nin durmasına yol açan sorun düzeltildi
    • Apple Silicon Mac'lerde bellek yetersizliği hatası düzeltildi
    • Mixtral mimarili modeller çalıştırılırken oluşan bellek yetersizliği hatası düzeltildi
  • Deneysel eşzamanlılık özelliği
    • OLLAMA_NUM_PARALLEL: tek bir model için birden fazla isteği aynı anda işler
    • OLLAMA_MAX_LOADED_MODELS: birden fazla modeli aynı anda yükler
    • Ortam değişkenlerinin ayarlanması gerekir
      • OLLAMA_NUM_PARALLEL=4 OLLAMA_MAX_LOADED_MODELS=4 ollama serve

1 yorum

 
siabard 2024-04-30

Birden fazla model kullanmam gerekiyordu; artık mümkün olmuş. ^^=b