-
R1 1776, Perplexity AI'ın Çin Komünist Partisi sansürünü kaldırmak için DeepSeek-R1 çıkarım modelini ince ayar yaptığı açık kaynaklı bir modeldir.
-
Önyargısız ve doğru bilgi sunmayı hedeflerken matematik/çıkarım yeteneklerini korumasıyla öne çıkıyor.
-
Model şu anda Hugging Face üzerinden indirilebilir.
-
Sansürü aşabilme olasılığını ölçmek için 1.000'den fazla çok dilli örnekten oluşan bir değerlendirme seti kullanıldı (insan değerlendiriciler + LLM judge birlikte).
-
Çin siyaseti/toplumu/insan hakları gibi hassas konularda kaçamak yapmadan yanıt verebiliyor.
-
Sansür kaldırma sürecinden sonra da MATH/GPQA gibi benchmark'larda temel modelle eşdeğer performansı koruyor
7 yorum
Koreli şirketlerde de kullanımını kısıtlamıyorlar mı acaba?
Çok iyi ^o^
DeepSeek belgesinde yazdığı gibi eğitimi tamamen aynı şekilde mi yaptılar?
Görünüşe göre DeepSeek-R1 muhakeme modelinin kendisi de açık kaynakmış.
Yalnızca eğitilmiş modelin sonucu yayımlanıyor; ham veriler açıklanmadığı için bu bir "open source" değil. Sınırlı da olsa zaten eğitilmiş bir model üzerinde ek eğitim yapmak veya onu değiştirmek mümkün, bu kez yayımlanan da bu şekilde düzenlenmiş bir sürüm.
Bu yüzden ben
open weightifadesini kullanmayı daha çok tercih ediyorum.Daha iyisinin de iyisi var.