Instruct Korea 2025 Ocak Meetup Duyurusu: “Dil Modellerini Araştırırken Fikirlerim ve Zorluklarım”
(lu.ma)2024 yılında Instruct Korea topluluğu https://instruct.kr, LogicKor liderlik tablosu (leaderboard) lansmanıyla birlikte, yaklaşık 700 araştırmacının gönüllü olarak kendi sonuçlarını paylaştığı Kore'nin en büyük açık kaynak dil modeli topluluklarından biri hâline geldi.
2025'in yeni yılıyla birlikte, Instruct Korea Discord topluluk üyelerinin araştırma trendleri ve haberlerini paylaşabilecekleri, ağ kurabilecekleri bir fırsat yaratmayı amaçlıyoruz. Bu meetup'ın konusu “Dil Modellerini Araştırırken Fikirlerim ve Zorluklarım”dır. Başkalarının deneyimlerini dinleyip, kendi araştırma fikirlerimizi paylaşarak farklı görüşlere sahip kişilerle etkileşimde bulunmayı umuyoruz.
Etkinlik 2025 yılının Ocak ayında, 25 (Cumartesi), 14~18 saatleri arasında yapılacaktır.
Mekan Gangnam İstasyonu yakınındaki Nonce (Yeoksam-dong 624-17) adresidir.
İletişim: https://instruct.kr
Mekan sponsoru: Nonce Community (https://nonce.community/)
Konuşmacı tanıtımı
Daha fazla konuşmacı güncellenmesi planlanmaktadır.
Go Seok-hyeon (Sionic AI)
Scala JVM diliyle doğal dil işleme alanındaki çalışmalarını anlatacak. Özellikle production seviyesinde Python tabanlı deep learning kodunu JVM diline taşıyarak serving (sunuma alma) sürecindeki deneyimini paylaşacak.
Kim Jisu (kuotient, Allgoize): Qwen2.5 Korece Model Geliştirme Hikâyesi
“Qwen2.5 Korece Model Geliştirme Hikâyesi” ile yenilikçi bir dil modeli geliştirme sürecini paylaşıyor. Özellikle m-ArenaHard'de 37.60 gibi çarpıcı bir performans artışını tetikleyen süreç dikkat çekici. SFT, Merging, Alignment gibi genel öğrenme pipeline'ını işlerken, katman değiştirme ve on-policy stratejisi eklenmesi gibi Kore'de ilk kez denenen teknik yenilikleri de tanıtıyor. 8B ve altındaki modellerde en iyi performansa ulaşmanın sırrını ayrıntılı şekilde anlatacak.
Lee Seung-yu (dopeornope, Marker AI): LLM Guidance ve Quantization
“LLM Guidance ve Quantization” başlığıyla, hızla gelişen LLM teknolojisinin güncel eğilimlerini öne çıkarıyor. Son dönemde yoğun şekilde araştırılan LLM guidance ve quantization tekniklerinin kavramları ve gelişim yönelimleri üzerine öngörü dolu bir analiz sunuyor.
Yoo Yong-sang: KRX Finans Dil Modeli Yarışması Gözlemi
“KRX Finans Dil Modeli Yarışması Gözlemi” ile alan odaklı model geliştirme konusunda sahadaki pratik deneyimleri paylaşıyor. MCQA benchmark performansını artırmak için domain adaptation ve continual pretraining stratejileri ile safety auditing hakkında derinlemesine içerik ele alıyor.
Choi Seon-ung: RAG Geliştirme Projesi Hikâyesi
Gerçek bir RAG geliştirme projesinin canlı saha deneyimlerini paylaşır. Özellikle proje süreçlerinde bulunan sorunları dürüstçe gösterip, bu yolla elde edilen dersleri ve iyileştirme yönlerini sunmayı planlıyor.
Jang Young-jun (yjoonjang): Korece Embedding Modeli
“C ve Korece Embedding Modeli” konulu olarak, huggingface.co/nlpai-lab üzerinden çeşitli embedding modellerinin özellikleri ve gerçek eğitim sürecindeki kritik noktaları paylaşıyor. Embedding model seçimiyle başlayan ve eğitim aşamasına kadar uzanan pratikte doğrudan uygulanabilir içgörüler aktarılacak.
Jeong Se-min (Sionic AI): Graph RAG ile Recsys Oluşturmak - Storm fooding
“Graph RAG ile Recsys Oluşturmak - Storm fooding” konusu çerçevesinde, graph tabanlı RAG sistemi kullanılarak recommendation sistemi geliştirme deneyimi paylaşılacak. Sistem tasarımından implementasyona kadar tüm süreçler ele alınacak.
Kim Dong-kyu (Jeffrey Kim, AutoRAG): GitHub'da 3 Bin Star Almak
“GitHub'da 3 Bin Star Almak” konusu üzerinden AutoRAG açık kaynak projesinin büyüme hikâyesi anlatılıyor. Projenin başlangıcından başarılı bir şekilde open-source olmaya kadar olan yolculuk ve gelecek gelişim yönü paylaşılacaktır.
maywell (instruct.kr, Wanot AI)
TBD
Henüz yorum yok.