OpenAI, 6 yıl aradan sonra açık kaynak LLM’i GPT-OSS’u duyurdu

(openai.com)

31 puan yazan haebom 2025-08-06 | 8 yorum | WhatsApp'ta paylaş

OpenAI, GPT-OSS model serisini (gpt-oss-120b / gpt-oss-20b) Apache 2.0 lisansıyla sürpriz şekilde yayımladı. GPT-2’den sonra 6 yıl aradan sonra gelen açık ağırlıklı model ve hem performans hem de verimlilik açısından pazarın dengesini değiştirme potansiyeline sahip.

🧠 Temel özellikler

20B model: Mixture of Experts (MoE) yapısı
• 128 uzmandan 4’ü etkinleştiriliyor → performansı korurken çıkarım maliyetini düşürüyor
• FlashAttention, 128k token desteği, YaRN içeriyor
20B model: 16GB GPU ortamında da çalışabiliyor (Apple Silicon dahil)

📊 Başlıca benchmark performansı (GPT-OSS-120B bazında)

MMLU: %90,0 (o4-mini ile benzer)
AIME matematik: %97,9 (matematik + araç kullanımında en üst seviye)
Codeforces Elo: 2622 (kodlama becerisi de üst düzey)
HealthBench: GPT-4o’ya kıyasla daha iyi performans
MMMLU (14 dil): %81,3 → çok dilli akıl yürütmede de güçlü

💡 Pratik kullanım & ekosistem

120B model tek bir H100 80GB GPU üzerinde çalıştırılabiliyor
20B model 16GB ortamda da gerçek zamanlı çalışıyor
HuggingFace, vLLM, Ollama vb. ile anında uyumlu

🔐 Güvenlik & sorumluluk

RL tabanlı akıl yürütme tutarlılığı güçlendirildi
Deliberative Alignment kullanıma alındı
Kasıtlı kötüye kullanımda bile yüksek riskli çıktı üretmiyor

Görünüşe göre bir süre daha "ClosedAI" diye alay edilmekten kurtulacak. Kısa bir test yaptım; Koreceyi de oldukça iyi kullanıyor.

https://huggingface.co/openai/gpt-oss-120b

8 yorum

yeorinhieut 2025-08-06

120b modelinin simpleqa puanı da 0.168 görünüyor.

jinucho 2025-08-06

vllm ile servis etmeyi denemiştim ama Flash Attention3 tabanlı olduğu için yalnızca Hopper destekleniyor ağla ağla

yeorinhieut 2025-08-06

Ben de bu yüzden ollama ile…

jinucho 2025-08-06

Artık tamamen gözden düşmüş A100...

xguru 2025-08-06

İlgili Hacker News yorumları için OpenAI, büyük ölçekli açık ağırlıklı dil modeli yayımladı yazısına bakın.
Performansa dair çeşitli değerlendirmeleri görebilirsiniz.

argo9 2025-08-06

Bilgisayarımın yavaş olduğunu anlamak istediğimde... aynı prompt ile süreyi doğrudan ölçerek test etsem nasıl olur diye düşünüyorum. ^^; Basit bir kayıt için bile bir Google Sheets açıp kenarda tutmak istiyorum (tamamen kayıt tutmanın keyfi için)

fanotify 2025-08-06

MXFP4 kuantizasyonu sayesinde Ollama'da 16GB bellek (VRAM) bulunan sistemlerde de çalıştırılabildiği söyleniyor (gpt-oss:20b): https://ollama.com/blog/gpt-oss

fanotify 2025-08-06

Daha büyük modelleri çalıştırmak isteyenler, bu kez kullanıma sunulan aylık 20 dolarlık ollama turbo'yu kullanabilir: https://ollama.com/turbo

OpenAI, 6 yıl aradan sonra açık kaynak LLM’i GPT-OSS’u duyurdu

İlgili okumalar

8 yorum