16 puan yazan xguru 2023-03-13 | 1 yorum | WhatsApp'ta paylaş
  • Amaç, LLaMA modelini MacBook'ta 4-bit kuantizasyon ile çalıştırmak
  • Bağımlılığı olmayan saf C/C++ uygulaması
  • Arm Neon/Accelerate framework'üne optimize edilmiş (Apple Silicon)
  • x86 için AVX2 desteği
  • Karma F16/F32 hassasiyeti
  • 4-bit kuantizasyon desteği
  • CPU üzerinde çalışır
  • Şu anda yalnızca Mac/Linux destekleniyor. Windows desteği planlanıyor

1 yorum

 
laeyoung 2023-03-14

7B modeli denedim, beklediğimden daha iyi çalışıyor.