llama.cpp - Facebook'un LLaMA modelini saf C/C++ ile çalıştırma

xguru · 2023-03-13T11:26:01+09:00

Amaç, LLaMA modelini MacBook'ta 4-bit kuantizasyon ile çalıştırmak Bağımlılığı olmayan saf C/C++ uygulaması Arm Neon/Accelerate framework'üne optimize edilmiş (Apple Silicon) x86 için AVX2 desteği Karma F16/F32 hassasiyeti 4-bit kuantizasyon desteği CPU üzerinde çalışır Şu anda yalnızca Mac/Linux destekleniyor. Windows desteği planlanıyor

(github.com/ggerganov)

16 puan yazan xguru 2023-03-13 | 1 yorum | WhatsApp'ta paylaş

Amaç, LLaMA modelini MacBook'ta 4-bit kuantizasyon ile çalıştırmak
Bağımlılığı olmayan saf C/C++ uygulaması
Arm Neon/Accelerate framework'üne optimize edilmiş (Apple Silicon)
x86 için AVX2 desteği
Karma F16/F32 hassasiyeti
4-bit kuantizasyon desteği
CPU üzerinde çalışır
Şu anda yalnızca Mac/Linux destekleniyor. Windows desteği planlanıyor

1 yorum

laeyoung 2023-03-14

7B modeli denedim, beklediğimden daha iyi çalışıyor.

llama.cpp - Facebook'un LLaMA modelini saf C/C++ ile çalıştırma

İlgili okumalar

1 yorum