LG AI Research EXAONE Deep'i duyurdu

lemonmint · 2025-03-19T10:45:38+09:00

LG AI Research tarafından geliştirilen yeni Reasoning AI modeli EXAONE Deep tanıtıldı Agentic AI çağına geçiş için kritik öneme sahip yüksek performanslı bir çıkarım modeli Matematik, bilim ve kodlama alanlarında üstün çıkarım yeteneği kanıtlandı Başlıca özellikler: Matematik: Zor matematik benchmark'larında rakip modellere kıyasla üstün performans (daha küçük model boyutuyla eşdeğer performans) Bilim & Kodlama: Önemli benchmark'larda 1. sıraya yerleşti (7.8B ve 2.4B modelleri) MMLU: Yerli modeller arasında en yüksek performans (32B model) Epoch AI'nin dikkate değer yapay zeka modelleri listesine alındı ve performansı doğrulandı (EXAONE 3.5'in ardından EXAONE serisinde ikinci kez) Matematik alanında üstün performans Tüm EXAONE Deep modelleri (32B, 7.8B, 2.4B), 2025 Üniversiteye Giriş Sınavı matematik bölümünde en yüksek puanı aldı EXAONE Deep 32B: Üniversiteye Giriş Sınavı matematiğinde 94.5, AIME 2024'te 90.0 puan aldı AIME 2025'te DeepSeek-R1 (671B) modeliyle eşdeğer performans gösterdi Özellikle zorlu bir benchmark olan AIME'de yüksek performans sergileyerek eğitim verimliliği ve maliyet etkinliğini kanıtladı EXAONE Deep 7.8B & 2.4B: Hafif model ve on-device model kategorilerinin her birinde önemli benchmark'larda 1. oldu 7.8B model: MATH-500'de 94.8, AIME 2025'te 59.6 puan 2.4B model: MATH-500'de 92.3, AIME 2024'te 47.9 puan Başlıca matematik benchmark'ları: CSAT (Üniversiteye Giriş Sınavı) AIME (American Invitational Mathematics Examination) MATH-500 Bilim ve kodlama alanında güçlü uzmanlık Bilim ve kodlama alanlarında da rakip modellere kıyasla üstün performans kanıtlandı EXAONE Deep 32B: GPQA Diamond testinde 66.1 puan (doktora düzeyinde bilimsel problem çözme yeteneği değerlendirmesi) LiveCodeBench'te 59.5 puan (kodlama yeteneği değerlendirmesi) ile benzer ölçekli Reasoning AI modellerini geride bıraktı Uzmanlık bilgisi gerektiren alanlarda da yüksek kullanım potansiyeline işaret ediyor EXAONE Deep 7.8B & 2.4B: GPQA Diamond ve LiveCodeBench'te 1. sıraya yerleşti EXAONE 3.5 2.4B modelinin ardından hafif/on-device model alanında küresel lider modellerden biri olarak konumlandı Başlıca bilim ve kodlama benchmark'ları: GPQA Diamond LiveCodeBench

(lgresearch.ai)

24 puan yazan lemonmint 2025-03-19 | 9 yorum | WhatsApp'ta paylaş

LG AI Research tarafından geliştirilen yeni Reasoning AI modeli EXAONE Deep tanıtıldı
Agentic AI çağına geçiş için kritik öneme sahip yüksek performanslı bir çıkarım modeli
Matematik, bilim ve kodlama alanlarında üstün çıkarım yeteneği kanıtlandı
Başlıca özellikler:
- Matematik: Zor matematik benchmark'larında rakip modellere kıyasla üstün performans (daha küçük model boyutuyla eşdeğer performans)
- Bilim & Kodlama: Önemli benchmark'larda 1. sıraya yerleşti (7.8B ve 2.4B modelleri)
- MMLU: Yerli modeller arasında en yüksek performans (32B model)
Epoch AI'nin dikkate değer yapay zeka modelleri listesine alındı ve performansı doğrulandı (EXAONE 3.5'in ardından EXAONE serisinde ikinci kez)

Matematik alanında üstün performans

Tüm EXAONE Deep modelleri (32B, 7.8B, 2.4B), 2025 Üniversiteye Giriş Sınavı matematik bölümünde en yüksek puanı aldı
EXAONE Deep 32B:
- Üniversiteye Giriş Sınavı matematiğinde 94.5, AIME 2024'te 90.0 puan aldı
- AIME 2025'te DeepSeek-R1 (671B) modeliyle eşdeğer performans gösterdi
- Özellikle zorlu bir benchmark olan AIME'de yüksek performans sergileyerek eğitim verimliliği ve maliyet etkinliğini kanıtladı
EXAONE Deep 7.8B & 2.4B:
- Hafif model ve on-device model kategorilerinin her birinde önemli benchmark'larda 1. oldu
- 7.8B model: MATH-500'de 94.8, AIME 2025'te 59.6 puan
- 2.4B model: MATH-500'de 92.3, AIME 2024'te 47.9 puan
Başlıca matematik benchmark'ları:
- CSAT (Üniversiteye Giriş Sınavı)
- AIME (American Invitational Mathematics Examination)
- MATH-500

Bilim ve kodlama alanında güçlü uzmanlık

Bilim ve kodlama alanlarında da rakip modellere kıyasla üstün performans kanıtlandı
EXAONE Deep 32B:
- GPQA Diamond testinde 66.1 puan (doktora düzeyinde bilimsel problem çözme yeteneği değerlendirmesi)
- LiveCodeBench'te 59.5 puan (kodlama yeteneği değerlendirmesi) ile benzer ölçekli Reasoning AI modellerini geride bıraktı
- Uzmanlık bilgisi gerektiren alanlarda da yüksek kullanım potansiyeline işaret ediyor
EXAONE Deep 7.8B & 2.4B:
- GPQA Diamond ve LiveCodeBench'te 1. sıraya yerleşti
- EXAONE 3.5 2.4B modelinin ardından hafif/on-device model alanında küresel lider modellerden biri olarak konumlandı
Başlıca bilim ve kodlama benchmark'ları:
- GPQA Diamond
- LiveCodeBench

9 yorum

sice81 2025-03-20

Vay canına, LG’yi destekliyorum. LLM konusunda neredeyse ülkemizin en iyisi değil mi? Dahili sistemlerde de iyi kullanıldığını duymuştum... Ama lisans kısmı biraz üzücü. Yeni sürüm çıktığında eski sürümü MIT lisansıyla açsalar harika olur.

mindok 2025-03-19

Dizüstünde yerel olarak çalıştırmak için EXAONE 3.5 de iyiydi, bu yüzden bunu da merakla bekliyorum.

bungker 2025-03-19

Gerçekten şaşırdım. Bunu sadece PR amaçlı sanmıştım ama LG gibi bu kadar muhafazakar bir şirketin böyle bir şey çıkarıp üstüne bir de açıkça yayımlaması...

halfenif 2025-03-20

Baktığım lisansa göre bunun nasıl kullanılabileceğini merak ediyorum.

Restrictions
3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
any commercial purposes, including but not limited to, developing or deploying products, services, or
applications that generate revenue, whether directly or indirectly.

3.1 Ticari kullanım: Lisans alanın, doğrudan ya da dolaylı olarak gelir yaratan ürünler, hizmetler veya uygulamalar geliştirmek ya da dağıtmak dahil olmak üzere; Modeli, türevlerini veya çıktılarını ticari amaçlarla kullanması açıkça yasaktır.

Ownership
4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
whether in its original form or modified, are and shall remain the exclusive property of the Licensor.

4.2 Çıktı: Orijinal haliyle ya da değiştirilmiş haliyle fark etmeksizin, Model ve türevleri tarafından üretilen çıktıya ilişkin tüm haklar, mülkiyet ve menfaatler Lisans Veren'in münhasır mülkiyetidir ve öyle kalacaktır.

yosemite 2025-03-20

Evet. Ticari kullanıma izin vermeyen bir lisans. Bu yüzden benim için değerlendirme dışı.

junia3 2025-03-19

Sunucuya kurup kullanmayı denedim ama qwq'ya kıyasla düşünme süresi çok uzuyor.
Doğru cevabı iyi verip vermediğini bilmem ama gecikme beklediğimden daha ciddi gibi hissettiriyor.

junia3 2025-03-19

Demek ki bu sadece bazı sorunlar için geçerliymiş. Birkaç tane daha çalıştırıp karşılaştırınca sonuçların benzer çıktığını görüyorum.

nowdoit7 2025-03-19

Destekliyorum~ LG~Hadi bakalım~

jujumilk3 2025-03-19

Destekliyorum. LinkedIn'de gördüğüm her yerde beğeni bırakıyorum.

LG AI Research EXAONE Deep'i duyurdu

Matematik alanında üstün performans

Bilim ve kodlama alanında güçlü uzmanlık

İlgili okumalar

9 yorum