Ollama’ya resmi DeepSeek R1 eklendi
(ollama.com)- DeepSeek’in ilk nesil çıkarım modeli R1, OpenAI-o1 ile kıyaslanabilir performansa sahip
- Matematik, kod ve akıl yürütme görevlerinde üstün performans gösteriyor
- Farklı boyutlarda modeller sunuluyor: 1.5B, 7B, 8B, 14B, 32B, 70B, 671B
- Her model belirli görevlere göre optimize edilmiş
- Lisans
- MIT lisansı altında sunuluyor
- Ücretsiz kullanılabiliyor ve ticari amaçlarla da kullanılabiliyor
4 yorum
R1'e kimliği sorulduğunda, kendisinin DeepSeek ile hiçbir ilgisi olmadığını ve OpenAI GPT olduğunu söylediğini belirtiyor.
2023 Ekim'e kadar eğitim verisi olduğunu söylemesi biraz tuhaf geliyor ..
DeepSeek-R1 modeli duyuruldu
Hacker News görüşleri
DeepSeek V3 siyasi hassasiyetleri tanıyor gibi görünüyor. "Tiananmen Meydanı neyle ünlüdür?" sorusuna "Üzgünüm, bu şu anda kapsam dışı" diye yanıt veriyor
R1 makalesine bakılırsa, benchmark'lar doğruysa 1.5b ve 7b modeller bile Claude 3.5 Sonnet'ten daha iyi. Bu modelleri 8-16GB MacBook'ta çalıştırabilmek inanılmaz
Başlık yanlış. Ollama'da yalnızca llama ve qwen'in damıtılmış modelleri var; deepseekv3'ün resmi MoE r1 modeli yok
1.5b modeline "Python'da bir listeyi nasıl ters çeviririm" diye sorunca durmadan düşüncelerini döküyor. Tekrar da etmiyor. İlginç
Dokümantasyon gerekli. Tüm proje açıklaması "büyük dil modelleriyle işe başlamak" gibi görünüyor
Bu modeli 3 yıllık bir dizüstü bilgisayarda çalıştırabilmek şaşırtıcı
fnanahtar kelimesi kullanılarak tanımlanır. Sayı türleri belirtilmediği için bunu generic yapıyorAddtrait'ini kullanıyor. Standart kütüphaneden içe aktarılması gerekiyorfn add_numbers<T: Add<Output = T>>(a: T, b: T) -> TşeklindeRust'ta iki sayıyı toplayan basit bir fonksiyon örneği veriyor
i32türünde iki tam sayıyı toplayan bir fonksiyonDeepSeek R1 modelinin en büyük sürümüyle çıkarım yapmak için hangi ücretli API seçenekleri olduğunu merak ediyorum
RTX 4090 ve 192GB RAM varken, DeepSeek R1'in hangi boyuttaki modelini yerelde çalıştırabileceğimi merak ediyorum
Nvidia 4070 için uygun model boyutunun ne olduğunu merak ediyorum
Ollama neredeyse kusursuz. Ancak Vulkan desteklememesi büyük bir sorun