24 puan yazan lemonmint 2025-03-19 | 9 yorum | WhatsApp'ta paylaş
  • LG AI Research tarafından geliştirilen yeni Reasoning AI modeli EXAONE Deep tanıtıldı
  • Agentic AI çağına geçiş için kritik öneme sahip yüksek performanslı bir çıkarım modeli
  • Matematik, bilim ve kodlama alanlarında üstün çıkarım yeteneği kanıtlandı
  • Başlıca özellikler:
    • Matematik: Zor matematik benchmark'larında rakip modellere kıyasla üstün performans (daha küçük model boyutuyla eşdeğer performans)
    • Bilim & Kodlama: Önemli benchmark'larda 1. sıraya yerleşti (7.8B ve 2.4B modelleri)
    • MMLU: Yerli modeller arasında en yüksek performans (32B model)
  • Epoch AI'nin dikkate değer yapay zeka modelleri listesine alındı ve performansı doğrulandı (EXAONE 3.5'in ardından EXAONE serisinde ikinci kez)

Matematik alanında üstün performans

  • Tüm EXAONE Deep modelleri (32B, 7.8B, 2.4B), 2025 Üniversiteye Giriş Sınavı matematik bölümünde en yüksek puanı aldı
  • EXAONE Deep 32B:
    • Üniversiteye Giriş Sınavı matematiğinde 94.5, AIME 2024'te 90.0 puan aldı
    • AIME 2025'te DeepSeek-R1 (671B) modeliyle eşdeğer performans gösterdi
    • Özellikle zorlu bir benchmark olan AIME'de yüksek performans sergileyerek eğitim verimliliği ve maliyet etkinliğini kanıtladı
  • EXAONE Deep 7.8B & 2.4B:
    • Hafif model ve on-device model kategorilerinin her birinde önemli benchmark'larda 1. oldu
    • 7.8B model: MATH-500'de 94.8, AIME 2025'te 59.6 puan
    • 2.4B model: MATH-500'de 92.3, AIME 2024'te 47.9 puan
  • Başlıca matematik benchmark'ları:
    • CSAT (Üniversiteye Giriş Sınavı)
    • AIME (American Invitational Mathematics Examination)
    • MATH-500

Bilim ve kodlama alanında güçlü uzmanlık

  • Bilim ve kodlama alanlarında da rakip modellere kıyasla üstün performans kanıtlandı
  • EXAONE Deep 32B:
    • GPQA Diamond testinde 66.1 puan (doktora düzeyinde bilimsel problem çözme yeteneği değerlendirmesi)
    • LiveCodeBench'te 59.5 puan (kodlama yeteneği değerlendirmesi) ile benzer ölçekli Reasoning AI modellerini geride bıraktı
    • Uzmanlık bilgisi gerektiren alanlarda da yüksek kullanım potansiyeline işaret ediyor
  • EXAONE Deep 7.8B & 2.4B:
    • GPQA Diamond ve LiveCodeBench'te 1. sıraya yerleşti
    • EXAONE 3.5 2.4B modelinin ardından hafif/on-device model alanında küresel lider modellerden biri olarak konumlandı
  • Başlıca bilim ve kodlama benchmark'ları:
    • GPQA Diamond
    • LiveCodeBench

9 yorum

 
sice81 2025-03-20

Vay canına, LG’yi destekliyorum. LLM konusunda neredeyse ülkemizin en iyisi değil mi? Dahili sistemlerde de iyi kullanıldığını duymuştum... Ama lisans kısmı biraz üzücü. Yeni sürüm çıktığında eski sürümü MIT lisansıyla açsalar harika olur.

 
mindok 2025-03-19

Dizüstünde yerel olarak çalıştırmak için EXAONE 3.5 de iyiydi, bu yüzden bunu da merakla bekliyorum.

 
bungker 2025-03-19

Gerçekten şaşırdım. Bunu sadece PR amaçlı sanmıştım ama LG gibi bu kadar muhafazakar bir şirketin böyle bir şey çıkarıp üstüne bir de açıkça yayımlaması...

 
halfenif 2025-03-20

Baktığım lisansa göre bunun nasıl kullanılabileceğini merak ediyorum.

  1. Restrictions
    3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
    any commercial purposes, including but not limited to, developing or deploying products, services, or
    applications that generate revenue, whether directly or indirectly.

3.1 Ticari kullanım: Lisans alanın, doğrudan ya da dolaylı olarak gelir yaratan ürünler, hizmetler veya uygulamalar geliştirmek ya da dağıtmak dahil olmak üzere; Modeli, türevlerini veya çıktılarını ticari amaçlarla kullanması açıkça yasaktır.

  1. Ownership
    4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
    whether in its original form or modified, are and shall remain the exclusive property of the Licensor.

4.2 Çıktı: Orijinal haliyle ya da değiştirilmiş haliyle fark etmeksizin, Model ve türevleri tarafından üretilen çıktıya ilişkin tüm haklar, mülkiyet ve menfaatler Lisans Veren'in münhasır mülkiyetidir ve öyle kalacaktır.

 
yosemite 2025-03-20

Evet. Ticari kullanıma izin vermeyen bir lisans. Bu yüzden benim için değerlendirme dışı.

 
junia3 2025-03-19

Sunucuya kurup kullanmayı denedim ama qwq'ya kıyasla düşünme süresi çok uzuyor.
Doğru cevabı iyi verip vermediğini bilmem ama gecikme beklediğimden daha ciddi gibi hissettiriyor.

 
junia3 2025-03-19

Demek ki bu sadece bazı sorunlar için geçerliymiş. Birkaç tane daha çalıştırıp karşılaştırınca sonuçların benzer çıktığını görüyorum.

 
nowdoit7 2025-03-19

Destekliyorum~ LG~Hadi bakalım~

 
jujumilk3 2025-03-19

Destekliyorum. LinkedIn'de gördüğüm her yerde beğeni bırakıyorum.