- Küçük dil modellerinin (SLM) potansiyelini kanıtlayan Phi serisinin duyurulmasının 1. yıl dönümünde, akıl yürütmeye optimize edilmiş ve çok adımlı düşünmede uzmanlaşmış yeni bir model ailesi duyuruldu
- Parametre ölçeği küçük olmasına rağmen büyük modellerle kıyaslanabilir performans gösteriyor
- Phi-4-reasoning: 14B parametre, yüksek kaliteli reasoning verileriyle SFT (Supervised Fine-Tuning) uygulandı
- Phi-4-reasoning-plus: Yukarıdaki modele RL (Reinforcement Learning) eklendi, 1,5 kat daha fazla token kullanımıyla doğruluk artırıldı
- Phi-4-mini-reasoning: 3.8B boyutuna rağmen çeşitli matematik benchmark'larında kendinden 2 kat daha büyük modelleri geride bırakıyor, mobil/edge için uygun
- OpenThinker-7B, Llama-3.2-3B, DeepSeek-R1 ailesi gibi çeşitli modelleri performans açısından geride bırakıyor
- OpenAI o1-mini ile benzer ya da daha iyi sonuçlar, özellikle Math-500, GPQA Diamond gibi matematik odaklı testlerde güçlü
- Bu modeller, Copilot+ PC'lerde NPU için optimize edilmiş sürüm olan Phi Silica olarak sunuluyor; böylece Windows ortamında hızlı ve verimli çalışabiliyor
- Azure AI Foundry ve HuggingFace üzerinden yayımlandı:
- Geliştirici API'leri ve yerel entegrasyon araçları da birlikte sunuluyor; böylece farklı ortamlara kolayca entegre edilebiliyor
Henüz yorum yok.