Microsoft, akıl yürütmeye optimize edilen Phi-4’ü duyurdu

xguru · 2025-05-02T11:36:01+09:00

Küçük dil modellerinin (SLM) potansiyelini kanıtlayan Phi serisinin duyurulmasının 1. yıl dönümünde, akıl yürütmeye optimize edilmiş ve çok adımlı düşünmede uzmanlaşmış yeni bir model ailesi duyuruldu Parametre ölçeği küçük olmasına rağmen büyük modellerle kıyaslanabilir performans gösteriyor Phi-4-reasoning: 14B parametre, yüksek kaliteli reasoning verileriyle SFT (Supervised Fine-Tuning) uygulandı Phi-4-reasoning-plus: Yukarıdaki modele RL (Reinforcement Learning) eklendi, 1,5 kat daha fazla token kullanımıyla doğruluk artırıldı Phi-4-mini-reasoning: 3.8B boyutuna rağmen çeşitli matematik benchmark'larında kendinden 2 kat daha büyük modelleri geride bırakıyor, mobil/edge için uygun OpenThinker-7B, Llama-3.2-3B, DeepSeek-R1 ailesi gibi çeşitli modelleri performans açısından geride bırakıyor OpenAI o1-mini ile benzer ya da daha iyi sonuçlar, özellikle Math-500, GPQA Diamond gibi matematik odaklı testlerde güçlü Bu modeller, Copilot+ PC'lerde NPU için optimize edilmiş sürüm olan Phi Silica olarak sunuluyor; böylece Windows ortamında hızlı ve verimli çalışabiliyor Azure AI Foundry ve HuggingFace üzerinden yayımlandı: Phi-4-reasoning Phi-4-reasoning-plus Phi-4-mini-reasoning Geliştirici API'leri ve yerel entegrasyon araçları da birlikte sunuluyor; böylece farklı ortamlara kolayca entegre edilebiliyor

(azure.microsoft.com)

3 puan yazan xguru 2025-05-02 | Henüz yorum yok. | WhatsApp'ta paylaş

Küçük dil modellerinin (SLM) potansiyelini kanıtlayan Phi serisinin duyurulmasının 1. yıl dönümünde, akıl yürütmeye optimize edilmiş ve çok adımlı düşünmede uzmanlaşmış yeni bir model ailesi duyuruldu
Parametre ölçeği küçük olmasına rağmen büyük modellerle kıyaslanabilir performans gösteriyor
Phi-4-reasoning: 14B parametre, yüksek kaliteli reasoning verileriyle SFT (Supervised Fine-Tuning) uygulandı
Phi-4-reasoning-plus: Yukarıdaki modele RL (Reinforcement Learning) eklendi, 1,5 kat daha fazla token kullanımıyla doğruluk artırıldı
Phi-4-mini-reasoning: 3.8B boyutuna rağmen çeşitli matematik benchmark'larında kendinden 2 kat daha büyük modelleri geride bırakıyor, mobil/edge için uygun
- OpenThinker-7B, Llama-3.2-3B, DeepSeek-R1 ailesi gibi çeşitli modelleri performans açısından geride bırakıyor
- OpenAI o1-mini ile benzer ya da daha iyi sonuçlar, özellikle Math-500, GPQA Diamond gibi matematik odaklı testlerde güçlü
Bu modeller, Copilot+ PC'lerde NPU için optimize edilmiş sürüm olan Phi Silica olarak sunuluyor; böylece Windows ortamında hızlı ve verimli çalışabiliyor
Azure AI Foundry ve HuggingFace üzerinden yayımlandı:
Geliştirici API'leri ve yerel entegrasyon araçları da birlikte sunuluyor; böylece farklı ortamlara kolayca entegre edilebiliyor

Microsoft, akıl yürütmeye optimize edilen Phi-4’ü duyurdu

İlgili okumalar

Henüz yorum yok.