3 puan yazan xguru 2025-05-02 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Küçük dil modellerinin (SLM) potansiyelini kanıtlayan Phi serisinin duyurulmasının 1. yıl dönümünde, akıl yürütmeye optimize edilmiş ve çok adımlı düşünmede uzmanlaşmış yeni bir model ailesi duyuruldu
  • Parametre ölçeği küçük olmasına rağmen büyük modellerle kıyaslanabilir performans gösteriyor
  • Phi-4-reasoning: 14B parametre, yüksek kaliteli reasoning verileriyle SFT (Supervised Fine-Tuning) uygulandı
  • Phi-4-reasoning-plus: Yukarıdaki modele RL (Reinforcement Learning) eklendi, 1,5 kat daha fazla token kullanımıyla doğruluk artırıldı
  • Phi-4-mini-reasoning: 3.8B boyutuna rağmen çeşitli matematik benchmark'larında kendinden 2 kat daha büyük modelleri geride bırakıyor, mobil/edge için uygun
    • OpenThinker-7B, Llama-3.2-3B, DeepSeek-R1 ailesi gibi çeşitli modelleri performans açısından geride bırakıyor
    • OpenAI o1-mini ile benzer ya da daha iyi sonuçlar, özellikle Math-500, GPQA Diamond gibi matematik odaklı testlerde güçlü
  • Bu modeller, Copilot+ PC'lerde NPU için optimize edilmiş sürüm olan Phi Silica olarak sunuluyor; böylece Windows ortamında hızlı ve verimli çalışabiliyor
  • Azure AI Foundry ve HuggingFace üzerinden yayımlandı:
  • Geliştirici API'leri ve yerel entegrasyon araçları da birlikte sunuluyor; böylece farklı ortamlara kolayca entegre edilebiliyor

Henüz yorum yok.

Henüz yorum yok.