[2023/12/11 ~ 12/17] Haftanın Öne Çıkan ML Makaleleri (Top ML Papers of the Week)
(discuss.pytorch.kr)Genel Bakış
-
DAIR.AI tarafından her hafta yayımlanan ML makalelerine dair yazıyı otomatik olarak çevirdik.
-
Bu hafta seçilen makalelere bakıldığında, araştırmaların ağırlıklı olarak 'LLM (Large Language Models)' üzerine yoğunlaştığı dikkat çekiyor. Özellikle matematik alanındaki keşifler, genelleme sorunu, tıp alanındaki uygulamalar ve insan verisinin ötesine geçen öğrenme yöntemleri gibi çeşitli konularda LLM’lerin kullanımını ve performans artışını inceleyen çalışmalar öne çıkıyor.
-
Bu eğilim, son yıllarda yapay zeka alanında LLM’lerin gelişiminin ne kadar dikkat çektiğini yansıtıyor. Özellikle OpenAI’nin GPT-3 gibi büyük dil modellerinin ortaya çıkmasıyla, bu modellerin farklı alanlarda kullanılabilme potansiyeli büyük ölçüde genişledi. Bu da LLM’lerin yalnızca basit metin işlemeyi aşarak karmaşık problem çözümünde de önemli bir rol oynayabileceğine işaret ediyor; bu haftaki makaleler de etkilerinin matematik ve tıp gibi geleneksel alanlara kadar yayıldığını gösteriyor. Ayrıca şeffaflık ve açıklığa verilen önemin artması, araştırma ve uygulama alanlarında güvenilirlik ile iş birliğinin önemini vurguluyor.
-
Ayrıca 'Weak-to-strong Generalization' ve 'Beyond Human Data for LLMs' gibi makaleler, LLM’lerin genelleme yeteneği ve öğrenme metodolojileri üzerine yürütülen araştırmalara işaret ediyor. Bu da, LLM’lerin bugün sahip olduğu sınırlı öğrenme ortamlarının ötesine geçerek daha güçlü öğrenme mekanizmaları geliştirme çabası olarak görülebilir. Bu eğilim, LLM araştırmalarının yalnızca performans artışına odaklanmanın ötesine geçtiğini ve modellerin genelleme kabiliyeti ile kullanım değerini köklü biçimde artırma yönünde ilerlediğini gösteriyor.
Matematiksel Bilimlerde Keşifler için LLM / LLMs for Discoveries in Mathematical Sciences
Makale tanıtımı
- Matematik ve bilgisayar bilimlerinde yeni çözümler aramak için LLM’leri kullanıyor; önceden eğitilmiş bir LLM ile sistematik bir değerlendiriciyi birleştirip bunları yinelemeli biçimde çalıştırarak düşük puanlı programları yeni bilgi keşfeden yüksek puanlı programlara dönüştüren funsearch’ü öneriyor; bu çalışmanın temel bulgularından biri, matematiksel keşifler ve diğer gerçek dünya problemlerinde sonuç üretebilmek için LLM halüsinasyonlarına karşı korunmanın önemli olduğudur.
> Uses llms to search for new solutions in mathematics & computer science; proposes funsearch which combines a pre-trained llm with a systematic evaluator and iterates over them to evolve low-scoring programs into high-scoring ones discovering new knowledge; one of the key findings in this work is that safeguarding against llm hallucinations is important to produce mathematical discoveries and other real-world problems.
Makale bağlantısı
https://www.nature.com/articles/s41586-023-06924-6
Daha fazlası
https://x.com/GoogleDeepMind/status/1735332722208284797
Zayıftan Güçlüye Genelleme / Weak-to-strong Generalization
Makale tanıtımı
- Zayıf model denetiminin daha güçlü modellerin tüm yeteneklerini ortaya çıkarıp çıkaramayacağını inceliyor; güçlü önceden eğitilmiş modeller zayıf modellerin ürettiği etiketlerle naif biçimde ince ayarlandığında, zayıf denetleyicilerinden daha iyi performans gösterebildiklerini buluyor; GPT-4’ün GPT-2 seviyesinde bir denetleyiciyle ince ayarlanmasının, NLP görevlerinde GPT-3.5 seviyesine yakın performansı geri kazandırabildiğini raporluyor.
> Studies whether weak model supervision can elicit the full capabilities of stronger models; finds that when naively fine-tuning strong pretrained models on weak model generated labels they can perform better than their weak supervisors; reports that finetuning gpt-4 with a gpt-2-level supervisor it’s possible to recover close to gpt-3.5-level performance on nlp tasks.
Makale bağlantısı
https://cdn.openai.com/papers/weak-to-strong-generalization.pdf
Daha fazlası
https://x.com/OpenAI/status/1735349718765715913
Audiobox
Makale tanıtımı
- Çeşitli ses modaliteleri üretebilen, flow-matching tabanlı birleşik bir model; kontrol edilebilirliği artırmak ve konuşma ile ses üretimi paradigmalarını birleştirmek için açıklama tabanlı ve örnek tabanlı prompt tasarımları kullanıyor; büyük miktarda etiketlenmemiş ses verisi üzerinde ön eğitim yapabilmek için öz denetimli bir infilling hedefini uyarlıyor; konuşma ve ses üretiminde güçlü performans sergiliyor ve yeni vokal ile akustik stillerde ses üretmenin yeni yollarını açıyor.
> A unified model based on flow-matching capable of generating various audio modalities; designs description-based and example-based prompting to enhance controllability and unify speech and sound generation paradigms; adapts a self-supervised infilling objective to pre-train on large quantities of unlabeled audio; performs well on speech and sound generation and unlocks new methods for generating audio with novel vocal and acoustic styles.
Makale bağlantısı
https://ai.meta.com/research/publications/…
Daha fazlası
https://x.com/AIatMeta/status/1734257634008531453
Matematiksel Dil Modelleri: Bir Derleme / Mathematical Language Models: A Survey
Makale tanıtımı
- Matematiksel görevlerde LLM’lerin kaydettiği ilerlemeye dair bir derleme; matematiksel sözel problem çözme ve teorem ispatı gibi görevler ile prompt teknikleri etrafındaki LLM araştırmalarına ilişkin makale ve kaynakları kapsıyor.
> A survey on the progress of llms on mathematical tasks; covers papers and resources on llm research around prompting techniques and tasks such as math word problem-solving and theorem proving.
Makale özeti
- Son yıllarda, matematik alanında Önceden Eğitilmiş Dil Modelleri (PLM'ler) ve Büyük Ölçekli Dil Modellerini (LLM'ler) kapsayan Dil Modellerinin (LM'ler) kullanımında dikkate değer ilerlemeler yaşandı. Bu makale, matematiksel LM'lere dair kapsamlı bir inceleme sunarak kritik araştırma çabalarını görevler ve metodolojiler olmak üzere iki farklı perspektiften sistematik biçimde sınıflandırıyor. Ortaya çıkan tablo, çok sayıda matematiksel LLM önerildiğini gösteriyor; bunlar ayrıca instruction learning, araç tabanlı yöntemler, temel CoT teknikleri ve gelişmiş CoT metodolojileri olarak ayrıştırılıyor. Ayrıca bu inceleme, eğitim veri kümeleri, benchmark veri kümeleri ve artırılmış veri kümeleri dahil olmak üzere 60'tan fazla matematik veri kümesinin derlenmesini de içeriyor. Matematiksel LM alanındaki başlıca zorlukları ele alan ve gelecekteki yönelimleri ortaya koyan bu inceleme, bu alanı ilerletmeye odaklanan araştırmacılar için gelecekteki yenilikleri kolaylaştırıp ilham verebilecek değerli bir kaynak olarak konumlanıyor.
> In recent years, there has been remarkable progress in leveraging Language Models (LMs), encompassing Pre-trained Language Models (PLMs) and Large-scale Language Models (LLMs), within the domain of mathematics. This paper conducts a comprehensive survey of mathematical LMs, systematically categorizing pivotal research endeavors from two distinct perspectives: tasks and methodologies. The landscape reveals a large number of proposed mathematical LLMs, which are further delineated into instruction learning, tool-based methods, fundamental CoT techniques, and advanced CoT methodologies. In addition, our survey entails the compilation of over 60 mathematical datasets, including training datasets, benchmark datasets, and augmented datasets. Addressing the primary challenges and delineating future trajectories within the field of mathematical LMs, this survey is positioned as a valuable resource, poised to facilitate and inspire future innovation among researchers invested in advancing this domain.
Makale bağlantısı
https://arxiv.org/abs/2312.07622
Daha fazlasını okuyun
https://x.com/omarsar0/status/1735323577392542084
LLM360: Tamamen şeffaf açık kaynaklı LLM'lere doğru yolculuk / LLM360: Towards Fully Transparent Open-Source LLMs
Makale tanıtımı
- Uçtan uca makine öğrenimi eğitim sürecini şeffaf ve yeniden üretilebilir hale getirerek açık ve işbirlikçi yapay zeka araştırmalarını desteklemek için LLM360'ı öneriyor; eğitim kodu, veri, ara checkpoint'ler ve analizler dahil olmak üzere sıfırdan ön eğitilmiş 7B parametreli LLM'ler Amber ve CrystalCoder'ı yayımlıyor.
> Proposes llm360 to support open and collaborative ai research by making the end-to-end llm training process transparent and reproducible; releases 7b parameter llms pre-trained from scratch, amber and crystalcoder, including their training code, data, intermediate checkpoints, and analyses.
Makale özeti
- Son dönemde LLaMA, Falcon ve Mistral gibi açık kaynaklı Büyük Dil Modellerindeki (LLM'ler) artış, yapay zeka uygulayıcılarına ve araştırmacılara çeşitli seçenekler sunuyor. Ancak çoğu LLM yalnızca nihai model ağırlıkları veya çıkarım kodu gibi kısmi artefaktlar yayımladı ve teknik raporlar giderek kapsamlarını üst düzey tasarım tercihleri ve yüzeysel istatistiklerle sınırlıyor. Bu tercihler, LLM eğitimine dair şeffaflığı azaltarak ve ekipleri eğitim sürecindeki birçok ayrıntıyı yeniden keşfetmeye zorlayarak alandaki ilerlemeyi engelliyor. Yazarlar, tüm eğitim kodunun ve verinin, model checkpoint'lerinin ve ara sonuçların topluluğa sunulmasını savunan, LLM'leri tamamen açık kaynak haline getirmeye yönelik bir girişim olan LLM360'ı tanıtıyor. LLM360'ın amacı, uçtan uca LLM eğitim sürecini herkes için şeffaf ve yeniden üretilebilir hale getirerek açık ve işbirlikçi yapay zeka araştırmalarını desteklemek. LLM360'ın ilk adımı olarak, eğitim kodu, veri, ara checkpoint'ler ve analizler dahil olmak üzere sıfırdan ön eğitilmiş iki adet 7B parametreli LLM olan Amber ve CrystalCoder yayımlanıyor (https://www.llm360.ai). Yazarlar, bu açık kaynak çabasıyla LLM'lerin sınırlarını sürekli ileri taşımaya kararlı olduklarını belirtiyor. Daha büyük ölçekli ve daha güçlü modeller üzerinde çalışılıyor ve bunlar gelecekte yayımlanacak.
> The recent surge in open-source Large Language Models (LLMs), such as LLaMA, Falcon, and Mistral, provides diverse options for AI practitioners and researchers. However, most LLMs have only released partial artifacts, such as the final model weights or inference code, and technical reports increasingly limit their scope to high-level design choices and surface statistics. These choices hinder progress in the field by degrading transparency into the training of LLMs and forcing teams to rediscover many details in the training process. We present LLM360, an initiative to fully open-source LLMs, which advocates for all training code and data, model checkpoints, and intermediate results to be made available to the community. The goal of LLM360 is to support open and collaborative AI research by making the end-to-end LLM training process transparent and reproducible by everyone. As a first step of LLM360, we release two 7B parameter LLMs pre-trained from scratch, Amber and CrystalCoder, including their training code, data, intermediate checkpoints, and analyses (at https://www.llm360.ai). We are committed to continually pushing the boundaries of LLMs through this open-source effort. More large-scale and stronger models are underway and will be released in the future.
Makale bağlantısı
https://arxiv.org/abs/2312.06550
Daha fazlasını okuyun
https://x.com/omarsar0/status/1734591071575744820
Tıp alanında büyük dil modellerine dair bir inceleme: İlkeler, uygulamalar ve zorluklar / A Survey of Large Language Models in Medicine: Principles, Applications, and Challenges
Makale tanıtımı
- Tıp alanında makine öğrenimine dair kapsamlı bir tarama çalışmasıdır (300'den fazla makalenin analizi); tıpta makine öğreniminin karşı karşıya olduğu ilkeler, uygulamalar ve zorluklara dair bir genel bakış içerir.
> A comprehensive survey (analyzing 300+ papers) on llms in medicine; includes an overview of the principles, applications, and challenges faced by llms in medicine.
Makale özeti
- ChatGPT gibi büyük dil modelleri (LLM'ler), etkileyici insan dili anlama ve üretme yetenekleri nedeniyle büyük ilgi görmektedir. Bu nedenle, hekimleri ve hasta bakımını desteklemek amacıyla LLM'lerin tıpta uygulanması, hem yapay zeka hem de klinik tıpta umut verici bir araştırma yönü olarak öne çıkmaktadır. Bu eğilimi yansıtmak amacıyla bu tarama, tıpta LLM'lerin ilkeleri, uygulamaları ve karşılaştıkları zorluklara dair kapsamlı bir genel bakış sunmaktadır. Özellikle şu soruları ele almayı amaçlıyoruz: 1) Tıbbi LLM'ler nasıl inşa edilebilir? 2) Tıbbi LLM'lerin downstream performansları nelerdir? 3) Tıbbi LLM'ler gerçek dünyadaki klinik uygulamada nasıl kullanılabilir? 4) Tıbbi LLM'lerin kullanımından ne tür zorluklar doğar? 5) Tıbbi LLM'leri nasıl daha iyi inşa edebilir ve kullanabiliriz? Sonuç olarak bu tarama, tıpta LLM'lerin fırsatları ve zorlukları hakkında içgörüler sunmayı ve pratik, etkili tıbbi LLM'ler inşa etmek için değerli bir kaynak olmayı amaçlamaktadır. Tıbbi LLM'lere ilişkin pratik rehberlerin düzenli olarak güncellenen listesine https://github.com/AI-in-Health/MedLLMsPracticalGuide adresinden ulaşılabilir.
> Large language models (LLMs), such as ChatGPT, have received substantial attention due to their impressive human language understanding and generation capabilities. Therefore, the application of LLMs in medicine to assist physicians and patient care emerges as a promising research direction in both artificial intelligence and clinical medicine. To reflect this trend, this survey provides a comprehensive overview of the principles, applications, and challenges faced by LLMs in medicine. Specifically, we aim to address the following questions: 1) How can medical LLMs be built? 2) What are the downstream performances of medical LLMs? 3) How can medical LLMs be utilized in real-world clinical practice? 4) What challenges arise from the use of medical LLMs? and 5) How can we better construct and utilize medical LLMs? As a result, this survey aims to provide insights into the opportunities and challenges of LLMs in medicine and serve as a valuable resource for constructing practical and effective medical LLMs. A regularly updated list of practical guides on medical LLMs can be found at https://github.com/AI-in-Health/MedLLMsPracticalGuide.
Makale bağlantısı
https://arxiv.org/abs/2311.05112
Daha fazlasını okuyun
https://x.com/omarsar0/status/1734599425568231513
İnsan Verisinin Ötesinde: Dil Modelleriyle Problem Çözme için Öz Eğitimi Ölçeklendirmek / Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models
Makale tanıtımı
- İnsan tarafından üretilen verilere olan bağımlılığı önemli ölçüde azaltabilecek, geri bildirimli bir öz eğitim yaklaşımı öneriyor; model tarafından üretilen veriler ile ödül fonksiyonunun birleşimi, problem çözme görevlerinde LLM'lerin performansını artırıyor.
> Proposes an approach for self-training with feedback that can substantially reduce dependence on human-generated data; the model-generated data combined with a reward function improves the performance of llms on problem-solving tasks.
Makale özeti
- Dil modellerini (LM'ler) insan tarafından üretilen veriler üzerinde ince ayar yapmak hâlâ yaygın bir uygulamadır. Ancak bu tür modellerin performansı çoğu zaman yüksek kaliteli insan verisinin miktarı ve çeşitliliğiyle sınırlıdır. Bu makalede, skaler geri bildirime erişebildiğimiz görevlerde, örneğin doğruluğun doğrulanabildiği matematik problemlerinde, insan verisinin ötesine geçip geçemeyeceğimizi araştırıyoruz. Bunun için beklenti-maksimizasyon temelli basit bir öz eğitim yöntemini inceliyoruz; buna ReST $^{EM}$ adını veriyoruz. Bu yöntemde (1) modelden örnekler üretiyor ve bunları ikili geri bildirim kullanarak filtreliyoruz, (2) modeli bu örnekler üzerinde ince ayar yapıyoruz ve (3) bu süreci birkaç kez tekrarlıyoruz. PaLM-2 modelleri kullanılarak ileri düzey MATH akıl yürütme ve APPS kodlama benchmark'larında yapılan testlerde, ReST $^{EM}$ yönteminin model boyutuyla birlikte elverişli biçimde ölçeklendiğini ve yalnızca insan verisi üzerinde ince ayar yapmayı belirgin şekilde geride bıraktığını görüyoruz. Genel olarak bulgularımız, geri bildirimli öz eğitimin insan tarafından üretilen verilere olan bağımlılığı önemli ölçüde azaltabileceğini göstermektedir.
> Fine-tuning language models(LMs) on human-generated data remains a prevalent practice. However, the performance of such models is often limited by the quantity and diversity of high-quality human data. In this paper, we explore whether we can go beyond human data on tasks where we have access to scalar feedback, for example, on math problems where one can verify correctness. To do so, we investigate a simple self-training method based on expectation-maximization, which we call ReST $^{EM}$, where we (1) generate samples from the model and filter them using binary feedback, (2) fine-tune the model on these samples, and (3) repeat this process a few times. Testing on advanced MATH reasoning and APPS coding benchmarks using PaLM-2 models, we find that ReST $^{EM}$ scales favorably with model size and significantly surpasses fine-tuning only on human data. Overall, our findings suggest self-training with feedback can substantially reduce dependence on human-generated data.
Makale bağlantısı
https://arxiv.org/abs/2312.06585
Daha fazlasını okuyun
https://x.com/omarsar0/status/1734953578274386002
Gaussian-SLAM
Makale tanıtımı
- Hız ve verimlilikten ödün vermeden gerçek dünya sahnelerini fotogerçekçi biçimde yeniden oluşturabilen nöral RGBD SLAM yöntemi, sahne temsili için klasik 3D Gaussian yaklaşımını genişleterek önceki yöntemlerin sınırlamalarını aşar.
> Hız ve verimlilikten ödün vermeden gerçek dünya sahnelerini fotogerçekçi biçimde yeniden oluşturabilen bir nöral RGBD SLAM yöntemi; önceki yöntemlerin sınırlamalarını aşmak için sahne temsili amacıyla klasik 3D Gaussian'ları genişletir.
Makale bağlantısı
https://vladimiryugay.github.io/gaussian_slam/
Daha fazlasını okuyun
https://x.com/vlyug/status/1734683948440252480
Pearl: Prodüksiyona hazır pekiştirmeli öğrenme ajanı / Pearl: A Production-ready Reinforcement Learning Agent
Makale tanıtımı
- Araştırmacıların ve uygulayıcıların, gözlemlenebilirliğin sınırlı, geri bildirimin seyrek ve olasallığın yüksek olduğu ortamlara uyum sağlayan RL yapay zeka ajanları geliştirmesine olanak tanıyan, prodüksiyona hazır yeni bir yapay zeka ajanı yazılım paketini tanıtır.
> Araştırmacıların ve uygulayıcıların, sınırlı gözlemlenebilirlik, seyrek geri bildirim ve yüksek stokastisiteye sahip ortamlara uyum sağlayan RL yapay zeka ajanları geliştirmesine olanak tanıyan yeni bir prodüksiyona hazır RL ajanı yazılım paketini tanıtıyor.
Makale özeti
- Pekiştirmeli öğrenme (RL), uzun vadeli hedeflere ulaşmak için çok yönlü bir çerçeve sunar. Bu genellik, gerçek dünyadaki akıllı sistemlerin karşılaştığı; gecikmeli ödüllerle başa çıkma, kısmi gözlemlenebilirliği ele alma, keşif-sömürü ikilemini çözme, çevrim içi performansı iyileştirmek için çevrim dışı verileri kullanma ve güvenlik kısıtlarının karşılandığından emin olma gibi çok çeşitli problemleri formüle etmemizi sağlar. RL araştırma topluluğu bu sorunların ele alınmasında kayda değer ilerleme kaydetmiş olsa da, mevcut açık kaynak RL kütüphaneleri RL çözüm hattının dar bir bölümüne odaklanma ve diğer yönleri büyük ölçüde ihmal etme eğilimindedir. Bu makale, bu zorlukları modüler bir şekilde ele almak üzere açıkça tasarlanmış, prodüksiyona hazır bir RL ajanı yazılım paketi olan Pearl'ü tanıtıyor. Makale, ön benchmark sonuçlarını sunmanın yanı sıra Pearl'ün üretim kullanımına hazır olduğunu göstermek için sektördeki benimsenme örneklerini de vurguluyor. Pearl, Github'da github.com/facebookresearch/pearl adresinde açık kaynak olarak sunulmaktadır ve resmi web sitesi pearlagent.github.io adresindedir.
> Reinforcement Learning (RL), uzun vadeli hedeflere ulaşmak için çok yönlü bir çerçeve sunar. Bu genelliği, gerçek dünyadaki akıllı sistemlerin karşılaştığı gecikmeli ödüllerle başa çıkma, kısmi gözlemlenebilirliği ele alma, keşif ve sömürü ikilemini çözme, çevrim içi performansı artırmak için çevrim dışı verilerden yararlanma ve güvenlik kısıtlarının karşılanmasını sağlama gibi geniş bir problem yelpazesini formüle etmemize olanak tanır. RL araştırma topluluğu bu sorunları ele almada kayda değer ilerleme sağlamış olsa da, mevcut açık kaynak RL kütüphaneleri RL çözüm hattının dar bir kısmına odaklanma ve diğer yönleri büyük ölçüde ihmal etme eğilimindedir. Bu makale, bu zorlukları modüler bir biçimde kucaklamak üzere açıkça tasarlanmış, prodüksiyona hazır bir RL ajanı yazılım paketi olan Pearl'ü tanıtmaktadır. Makale, ön benchmark sonuçlarını sunmanın yanı sıra Pearl'ün sektördeki benimsenme örneklerini de öne çıkararak prodüksiyon kullanımına hazır olduğunu göstermektedir. Pearl, Github'da github.com/facebookresearch/pearl adresinde açık kaynak olarak yayımlanmıştır ve resmi web sitesi pearlagent.github.io adresindedir.
Makale bağlantısı
https://arxiv.org/abs/2312.03814
Daha fazlasını okuyun
https://x.com/ZheqingZhu/status/1732880717263352149
Quip / Quip
Makale tanıtımı
- Eğitilmiş model ağırlıklarını daha düşük hassasiyetli bir biçime sıkıştırarak bellek gereksinimlerini azaltır; yaklaşım, 2 bit kuantize modeller oluşturmak için lattice codebook'ları ve incoherence processing'i birleştirir; 2 bit kuantize LLM'ler ile kuantize edilmemiş 16 bit modeller arasındaki farkı önemli ölçüde kapatır.
> Eğitilmiş model ağırlıklarını bellek gereksinimlerini azaltmak için daha düşük hassasiyetli bir formata sıkıştırır; yaklaşım, 2 bit kuantize modeller oluşturmak için lattice codebook'ları ile incoherence processing'i birleştirir; 2 bit kuantize edilmiş LLM'ler ile kuantize edilmemiş 16 bit modeller arasındaki farkı önemli ölçüde azaltır.
Makale bağlantısı
https://cornell-relaxml.github.io/quip-sharp/
Daha fazlasını okuyun
https://x.com/tsengalb99/status/1733222467953422702
Orijinal metin
https://nlp.elvissaravia.com/p/top-ml-papers-of-the-week-c22
Henüz yorum yok.