31 puan yazan haebom 2025-08-06 | Henüz yorum yok. | WhatsApp'ta paylaş

OpenAI, GPT-OSS model serisini (gpt-oss-120b / gpt-oss-20b) Apache 2.0 lisansıyla sürpriz şekilde yayımladı. GPT-2’den sonra 6 yıl aradan sonra gelen açık ağırlıklı model ve hem performans hem de verimlilik açısından pazarın dengesini değiştirme potansiyeline sahip.

🧠 Temel özellikler

  • 20B model: Mixture of Experts (MoE) yapısı
     • 128 uzmandan 4’ü etkinleştiriliyor → performansı korurken çıkarım maliyetini düşürüyor
     • FlashAttention, 128k token desteği, YaRN içeriyor
  • 20B model: 16GB GPU ortamında da çalışabiliyor (Apple Silicon dahil)

📊 Başlıca benchmark performansı (GPT-OSS-120B bazında)

  • MMLU: %90,0 (o4-mini ile benzer)
  • AIME matematik: %97,9 (matematik + araç kullanımında en üst seviye)
  • Codeforces Elo: 2622 (kodlama becerisi de üst düzey)
  • HealthBench: GPT-4o’ya kıyasla daha iyi performans
  • MMMLU (14 dil): %81,3 → çok dilli akıl yürütmede de güçlü

💡 Pratik kullanım & ekosistem

  • 120B model tek bir H100 80GB GPU üzerinde çalıştırılabiliyor
  • 20B model 16GB ortamda da gerçek zamanlı çalışıyor
  • HuggingFace, vLLM, Ollama vb. ile anında uyumlu

🔐 Güvenlik & sorumluluk

  • RL tabanlı akıl yürütme tutarlılığı güçlendirildi
  • Deliberative Alignment kullanıma alındı
  • Kasıtlı kötüye kullanımda bile yüksek riskli çıktı üretmiyor

Görünüşe göre bir süre daha "ClosedAI" diye alay edilmekten kurtulacak. Kısa bir test yaptım; Koreceyi de oldukça iyi kullanıyor.

https://huggingface.co/openai/gpt-oss-120b

Henüz yorum yok.

Henüz yorum yok.