3 puan yazan ninebow 2024-06-13 | Henüz yorum yok. | WhatsApp'ta paylaş
  • DAIR.AI tarafından her hafta yayımlanan ML makalelerine dair yazılar otomatik olarak çevrildi.

  • Bu hafta seçilen makalelere bakıldığında, makalelerin çoğunun büyük dil modellerine (LLMs) odaklanma eğiliminde olduğu görülüyor. Daha somut olarak bu durum, büyük dil modellerinden kavram çıkarımı (Extracting Concepts from GPT-4), verimlilik artışı (MatMul-free LLMs), modelin düşünme sürecini anlama (Buffer of Thoughts), LLMs’in geometrik yapısı (The Geometry of Concepts in LLMs) ve bu modellerin hizalanması (Aligning LLMs with Demonstrated Feedback, Towards Scalable Automated Alignment of LLMs) üzerine araştırmalarla özetlenebilir. Bu başlıklar, yapay zeka alanında LLMs’i anlama, iyileştirme ve uygulama olanaklarını araştırmaya yönelik güncel ilgiyi yansıtıyor. Her ne kadar tüm makalelerin içeriği ayrıntılı biçimde incelenmemiş olsa da, yalnızca başlıklar bile son dönemdeki araştırma eğilimlerini kavramak için yeterli görünüyor.

  • Bu eğilim birkaç nedenle açıklanabilir. Öncelikle, GPT-4 gibi büyük dil modellerinin başarısının ardından yapay zeka araştırmalarında bu modellere yönelik ilgi hızla arttı. Bu modeller, doğal dil işleme (NLP) başta olmak üzere çeşitli bilgi işlerinde insan seviyesinde performansa ulaşmada önemli rol oynuyor. İkinci olarak, LLMs’i anlamak ve geliştirmek, daha karmaşık ve yaratıcı görevleri yerine getirebilen AI sistemlerinin geliştirilmesine kapı aralayabilir. Son olarak, bu tür araştırmalar model davranışını anlamaya ve denetlemeye yönelik tekniklerin gelişmesine katkı sağlayarak AI’nin güvenliği ve etik kullanımını güçlendirmek açısından da kritik olabilir. Sonuç olarak bu hafta seçilen makaleler, AI teknolojilerinin, özellikle de büyük dil modellerinin gelişimindeki en ileri noktada yürütülen araştırma ve deneyleri yansıtıyor.


NLLB: Sinirsel makine çevirisini 200 dile ölçeklendirmek / Scaling neural machine translation to 200 languages

Makale tanıtımı

200 dil arasında transfer öğrenmeden yararlanan devasa bir çok dilli model öneriliyor; model, seyrek kapılı Mixture of Experts mimarisine dayanıyor, düşük kaynaklı dillere uyarlanmış bir yaklaşımla elde edilen verilerle eğitiliyor ve 40 bin çeviri üzerinden yapılan değerlendirmede çeviri kalitesinde ortalama %44 iyileşme sağlıyor.

Proposes a massive multilingual model that leverages transfer learning across 200 languages; it’s based on a sparsely Gated Mixture of Experts architecture and trained on data via an approach tailored for low-resource languages; evaluates on 40K translations and achieves an average of 44% improvement in translation quality.

Makale özeti (Abstract)

Sinirsel tekniklerdeki gelişim, makine çevirisi araştırmalarında yeni yollar açtı. Günümüzde sinirsel makine çevirisi (NMT) sistemleri, yüksek düzeyde çok dilli kapasiteden yararlanabiliyor ve hatta zero-shot çeviri de gerçekleştirebiliyor; bu da dil kapsamı ve kalite açısından umut verici sonuçlar sunuyor. Ancak kaliteli NMT’yi ölçeklendirmek, büyük hacimde paralel iki dilli veri gerektiriyor ve bu veriler dünyadaki 7.000’den fazla dil için eşit ölçüde mevcut değil. Görece az sayıdaki yüksek kaynaklı dil grubunun çeviri kalitesini iyileştirmeye odaklanmak, düşük kaynaklı dillere yönelik araştırma ilgisinin azalması pahasına gerçekleşiyor ve uzun vadede dijital eşitsizlikleri derinleştirebiliyor. Bu kalıbı kırmak için, diller arasında transfer öğrenmeden yararlanan tek ve son derece büyük çok dilli bir model olan No Language Left Behind (NLLB)’i tanıtıyoruz. Düşük kaynaklı dillere uyarlanmış yeni veri madenciliği teknikleriyle elde edilen veriler üzerinde eğittiğimiz, Sparsely Gated Mixture of Experts mimarisine dayalı koşullu bir hesaplama modeli geliştirdik. Ayrıca binlerce görev üzerinde eğitim sırasında aşırı öğrenmeyi önlemek için çeşitli mimari ve eğitim iyileştirmeleri tasarladık. Modelimizin performansını, bu amaç için özel olarak geliştirilen araçlarla — otomatik bir benchmark (FLORES-200), insan değerlendirme metriği (XSTS) ve modeldeki tüm dilleri kapsayan bir toksisite dedektörü — 40.000’den fazla çeviri yönü üzerinde değerlendirdik. Önceki en ileri modellerle karşılaştırıldığında, modelimiz BLEU ile ölçülen çeviri kalitesinde ortalama %44 iyileşme sağladı. NMT’nin 200 dile nasıl ölçeklendirilebileceğini göstererek ve bu çalışmadaki tüm katkıları ticari olmayan kullanım için ücretsiz erişime açarak, evrensel bir çeviri sisteminin geliştirilmesi için önemli bir temel oluşturduk.

The development of neural techniques has opened up new avenues for research in machine translation. Today, neural machine translation (NMT) systems can leverage highly multilingual capacities and even perform zero-shot translation, delivering promising results in terms of language coverage and quality. However, scaling quality NMT requires large volumes of parallel bilingual data, which are not equally available for the 7,000+ languages in the world. Focusing on improving the translation qualities of a relatively small group of high-resource languages comes at the expense of directing research attention to low-resource languages, exacerbating digital inequities in the long run. To break this pattern, here we introduce No Language Left Behind—a single massively multilingual model that leverages transfer learning across languages. We developed a conditional computational model based on the Sparsely Gated Mixture of Experts architecture, which we trained on data obtained with new mining techniques tailored for low-resource languages. Furthermore, we devised multiple architectural and training improvements to counteract overfitting while training on thousands of tasks. We evaluated the performance of our model over 40,000 translation directions using tools created specifically for this purpose—an automatic benchmark (FLORES-200), a human evaluation metric (XSTS) and a toxicity detector that covers every language in our model. Compared with the previous state-of-the-art models, our model achieves an average of 44% improvement in translation quality as measured by BLEU. By demonstrating how to scale NMT to 200 languages and making all contributions in this effort freely available for non-commercial use, our work lays important groundwork for the development of a universal translation system.

Makale bağlantısı

https://www.nature.com/articles/s41586-024-07335-x

Daha fazlası

https://github.com/facebookresearch/fairseq/tree/nllb

https://x.com/AIatMeta/status/1798420492774432769


GPT-4’ten kavram çıkarmak / Extracting Concepts from GPT-4

Araştırma tanıtımı

GPT-4'ten yaklaşık 16 milyon yorumlanabilir örüntü çıkarmak için seyrek otomatik kodlayıcılara dayalı, ölçeklenebilir yeni bir yöntem öneriliyor. Bu yöntem öngörülebilir ölçeklenebilirlik gösteriyor ve önceki tekniklerden daha verimli.
> GPT-4'ten yaklaşık 16 milyon yorumlanabilir örüntü çıkarmak için seyrek otomatik kodlayıcılara dayalı, ölçeklenebilir yeni bir yöntem öneriyor; yöntem öngörülebilir ölçeklenebilirlik sergiliyor ve önceki tekniklerden daha verimli.

Makale özeti

SAE (Sparse AutoEncoder, seyrek otomatik kodlayıcı), seyrek darboğaz katmanından aktivasyonları yeniden oluşturarak dil modellerinden yorumlanabilir özellikler çıkarmak için umut verici bir gözetimsiz yaklaşım sunar. Dil modelleri çok sayıda kavram öğrendiğinden, ilgili tüm özellikleri geri kazanmak için otomatik kodlayıcıların çok büyük olması gerekir. Ancak yeniden yapılandırma ve seyreklik hedefleri arasında denge kurma gerekliliği ve ölü latentlerin varlığı nedeniyle otomatik kodlayıcı ölçeklemenin özelliklerini incelemek zordur. Biz, seyreklik üzerinde doğrudan kontrol sağlamak için K-sparse otomatik kodlayıcıları [Makhzani and Frey, 2013] kullanmayı öneriyoruz; bu da ayarlamayı basitleştiriyor ve yeniden yapılandırma-seyreklik sınırını iyileştiriyor. Ayrıca, denediğimiz en büyük ölçeklerde bile çok az ölü latent ortaya çıkaran değişiklikler bulduk. Bu teknikleri kullanarak, otomatik kodlayıcı boyutu ve seyreklik açısından temiz ölçekleme yasaları elde ettik. Ayrıca varsayılan özelliklerin geri kazanımı, aktivasyon örüntülerinin açıklanabilirliği ve aşağı akış etkilerinin seyrekliği temelinde özellik kalitesini değerlendirmek için birkaç yeni metrik sunuyoruz. Bu metriklerin tümü genel olarak otomatik kodlayıcı boyutu arttıkça iyileşiyor. Yaklaşımımızın ölçeklenebilirliğini göstermek için, 40 milyar token üzerinde GPT-4 aktivasyonlarıyla 16 milyon latentli bir otomatik kodlayıcı eğittik. Açık kaynak modeller için kodu ve otomatik kodlayıcıları, ayrıca bir görselleştiriciyi yayımlıyoruz.
> Sparse autoencoders provide a promising unsupervised approach for extracting interpretable features from a language model by reconstructing activations from a sparse bottleneck layer. Since language models learn many concepts, autoencoders need to be very large to recover all relevant features. However, studying the properties of autoencoder scaling is difficult due to the need to balance reconstruction and sparsity objectives and the presence of dead latents. We propose using k-sparse autoencoders [Makhzani and Frey, 2013] to directly control sparsity, simplifying tuning and improving the reconstruction-sparsity frontier. Additionally, we find modifications that result in few dead latents, even at the largest scales we tried. Using these techniques, we find clean scaling laws with respect to autoencoder size and sparsity. We also introduce several new metrics for evaluating feature quality based on the recovery of hypothesized features, the explainability of activation patterns, and the sparsity of downstream effects. These metrics all generally improve with autoencoder size. To demonstrate the scalability of our approach, we train a 16 million latent autoencoder on GPT-4 activations for 40 billion tokens. We release code and autoencoders for open-source models, as well as a visualizer.

Araştırma ve makale bağlantıları

https://openai.com/index/extracting-concepts-from-gpt-4/

https://cdn.openai.com/papers/sparse-autoencoders.pdf

Daha fazlası

https://github.com/openai/sparse_autoencoder

https://openaipublic.blob.core.windows.net/sparse-autoencoder/…

https://x.com/OpenAI/status/1798762092528586945


Transformer'lar SSM'dir: Yapılandırılmış Durum Uzayı İkiliği Yoluyla Genelleştirilmiş Modeller ve Verimli Algoritmalar / Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Makale tanıtımı

Durum uzayı modellerini (SSM) ve yapılandırılmış attention'ı birleştiren yeni bir mimari, 8 kat daha büyük durumlar kullanıyor ve %50 daha hızlı eğitiliyor; yeni durum uzayı ikiliği katmanı, Mamba'da kullanılan yaklaşıma kıyasla daha verimli ve daha ölçeklenebilir; ayrıca büyük durum kapasitesi gerektiren görevlerde sonuçları iyileştiriyor.
> A new architecture that combines state space models (SSMs) and structured attention; it uses 8x larger states and trains 50% faster; the new state space duality layer is more efficient and scalable compared to the approach used in Mamba; it also improves results on tasks that require large state capacity.

Makale özeti (Abstract)

Transformer'lar, dil modellemede derin öğrenmenin başarısının arkasındaki başlıca mimari olsa da, son dönemde Mamba gibi durum uzayı modellerinin (SSM) küçük ve orta ölçekte Transformer'larla eşleşebildiği ya da onları aşabildiği gösterildi. Biz, bu model ailelerinin aslında birbirleriyle oldukça yakından ilişkili olduğunu gösteriyor ve iyi çalışılmış yapılandırılmış yarı-ayrılabilir matrisler sınıfının çeşitli ayrışımları üzerinden bağlanan SSM'ler ile attention varyantları arasındaki zengin teorik bağlantılar için bir çerçeve geliştiriyoruz. Durum uzayı ikiliği (SSD) çerçevemiz, dil modellemede Transformer'larla rekabetçi kalmaya devam ederken, Mamba'nın seçici SSM'inin temel katmanını 2-8 kat daha hızlı hâle getiren yeni bir mimari (Mamba-2) tasarlamamıza olanak tanıyor.
> While Transformers have been the main architecture behind deep learning's success in language modeling, state-space models (SSMs) such as Mamba have recently been shown to match or outperform Transformers at small to medium scale. We show that these families of models are actually quite closely related, and develop a rich framework of theoretical connections between SSMs and variants of attention, connected through various decompositions of a well-studied class of structured semiseparable matrices. Our state space duality (SSD) framework allows us to design a new architecture (Mamba-2) whose core layer is an a refinement of Mamba's selective SSM that is 2-8X faster, while continuing to be competitive with Transformers on language modeling.

Makale bağlantısı

https://arxiv.org/abs/2405.21060

Daha fazla oku

https://x.com/_albertgu/status/1797651223035904355


Ölçeklenebilir, matris çarpımı (MatMul) içermeyen dil modelleme / Scalable MatMul-free Language Modeling

Makale tanıtımı

LLM’lerde matris çarpımı işlemlerini ortadan kaldırırken 1 milyar parametre ölçeğinde performansı koruyan bir uygulama öneriyor; model boyutu büyüdükçe tam hassasiyetli Transformer’lar ile MatMul içermeyen modeller arasındaki performans farkının kapandığını ve çıkarım sırasında optimize edilmiş kernel kullanıldığında bellek tüketiminin 10 kattan fazla azaldığını öne sürüyor.
> LLM’lerden matrix multiplication işlemlerini kaldırırken milyar parametre ölçeğinde performansı koruyan bir uygulama öneriyor; tam hassasiyetli Transformer’lar ile MatMul-free modeller arasındaki performans farkı model boyutu arttıkça daralıyor; çıkarım sırasında optimize edilmiş bir kernel kullanılarak bellek tüketiminin 10 kattan fazla azaltıldığı iddia ediliyor.

Makale özeti (Abstract)

Genel olarak matris çarpımı (MatMul), büyük dil modellerinin (LLM) toplam hesaplama maliyetinin en büyük kısmını oluşturur. Bu maliyet, LLM’ler daha büyük gömme boyutlarına ve bağlam uzunluklarına ölçeklendikçe yalnızca artar. Bu çalışmada, 1 milyar parametre ölçeğinde güçlü performansı korurken LLM’lerden MatMul işlemlerinin tamamen kaldırılabileceğini gösteriyoruz. Deneylerimiz, önerdiğimiz MatMul içermeyen modellerin, en az 2.7B parametre ölçeğine kadar, çıkarım sırasında çok daha fazla bellek gerektiren en güncel Transformer’larla aynı seviyede performans elde ettiğini gösteriyor. Ölçekleme yasalarını incelediğimizde, model boyutu büyüdükçe MatMul-free modeller ile tam hassasiyetli Transformer’lar arasındaki performans farkının kapandığını bulduk. Ayrıca bu modelin GPU açısından verimli bir uygulamasını sunuyoruz; bu uygulama, eğitim sırasında optimize edilmemiş bir temel çizgiye kıyasla bellek kullanımını %61’e kadar azaltıyor. Çıkarım sırasında optimize edilmiş bir kernel kullanıldığında, modelimizin bellek tüketimi optimize edilmemiş modellere göre 10 kattan fazla azaltılabiliyor. Mimari verimliliğimizi doğru biçimde ölçmek için, GPU’ların yapabildiklerinin ötesinde hafif işlemlerden yararlanan FPGA üzerinde özel bir donanım çözümü kurduk. İnsan tarafından okunabilir çıktının ötesindeki bir işlem hacminde, 13W ile milyar parametre ölçeğindeki modelleri çalıştırarak LLM’leri beyin benzeri verimliliğe biraz daha yaklaştırdık. Bu çalışma, LLM’lerin etkili performansı korurken ne kadar sadeleştirilebileceğini göstermekle kalmıyor, aynı zamanda gelecek nesil hafif LLM’leri işlerken gelecekteki hızlandırıcıların hangi işlem türleri için optimize edilmesi gerektiğine de işaret ediyor. Kod uygulaması \url{https://github.com/ridgerchu/matmulfreellm} adresinde bulunabilir.
> Matrix multiplication (MatMul) typically dominates the overall computational cost of large language models (LLMs). This cost only grows as LLMs scale to larger embedding dimensions and context lengths. In this work, we show that MatMul operations can be completely eliminated from LLMs while maintaining strong performance at billion-parameter scales. Our experiments show that our proposed MatMul-free models achieve performance on-par with state-of-the-art Transformers that require far more memory during inference at a scale up to at least 2.7B parameters. We investigate the scaling laws and find that the performance gap between our MatMul-free models and full precision Transformers narrows as the model size increases. We also provide a GPU-efficient implementation of this model which reduces memory usage by up to 61% over an unoptimized baseline during training. By utilizing an optimized kernel during inference, our model's memory consumption can be reduced by more than 10x compared to unoptimized models. To properly quantify the efficiency of our architecture, we build a custom hardware solution on an FPGA which exploits lightweight operations beyond what GPUs are capable of. We processed billion-parameter scale models at 13W beyond human readable throughput, moving LLMs closer to brain-like efficiency. This work not only shows how far LLMs can be stripped back while still performing effectively, but also points at the types of operations future accelerators should be optimized for in processing the next generation of lightweight LLMs. Our code implementation is available at \url{https://github.com/ridgerchu/matmulfreellm}.

Makale bağlantısı

https://arxiv.org/abs/2406.02528

Daha fazla oku

https://github.com/ridgerchu/matmulfreellm

https://x.com/omarsar0/status/1798373841741185261


Düşünce tamponu: büyük dil modelleriyle düşünce destekli akıl yürütme / Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models

Makale tanıtımı

LLM tabanlı akıl yürütmenin doğruluğunu, verimliliğini ve sağlamlığını artırmak için düşünce destekli bir akıl yürütme yaklaşımı sunuyor. Problem çözme süreçlerinden damıtılmış yüksek seviyeli düşünceler (düşünce şablonları) içeren bir meta tampon kullanıyor; ardından ilgili düşünce şablonu alınarak düşünce destekli akıl yürütme süreci için göreve özgü akıl yürütme yapılarıyla somutlaştırılıyor. Tree-of-Thoughts gibi çoklu sorgulu prompt yöntemlerinin maliyetinin %12’siyle 10 zorlu görevde SOTA performans gösterdi.
> LLM tabanlı akıl yürütmenin doğruluğunu, verimliliğini ve sağlamlığını artırmak için düşünce destekli bir akıl yürütme yaklaşımı sunuyor; problem çözme süreçlerinden damıtılmış üst düzey düşünceler (düşünce şablonları) içeren bir meta tampondan yararlanıyor; ilgili düşünce şablonu daha sonra alınarak düşünce destekli akıl yürütme süreci için göreve özgü akıl yürütme yapılarıyla somutlaştırılıyor; Tree-of-Thoughts gibi çoklu sorgulu prompt yöntemlerinin maliyetinin %12’siyle 10 zorlu görevte SOTA performans sergiliyor.

Makale özeti (Abstract)

Büyük dil modellerinin (LLM) doğruluk, verimlilik ve sağlamlığını artırmaya yönelik yeni ve çok yönlü, düşünceyle zenginleştirilmiş bir akıl yürütme yaklaşımı olan Buffer of Thoughts (BoT) tanıtılıyor. Özellikle, çeşitli görevlerdeki problem çözme süreçlerinden damıtılmış bir dizi bilgilendirici üst düzey düşünceyi, yani thought-template'leri depolayan bir meta-buffer öneriliyor. Ardından her problem için ilgili bir thought-template geri getirilip belirli akıl yürütme yapılarıyla uyarlanarak örnekleniyor ve verimli akıl yürütme gerçekleştiriliyor. Ayrıca ölçeklenebilirlik ve kararlılığı garanti altına almak için meta-buffer'ı dinamik olarak güncelleyen bir buffer-manager öneriliyor; böylece daha fazla görev çözüldükçe meta-buffer'ın kapasitesi artırılıyor. 10 zorlu, akıl yürütme yoğun görev üzerinde yürütülen kapsamlı deneyler sonucunda, önceki SOTA yöntemlerine kıyasla Game of 24'te %11, Geometric Shapes'ta %20 ve Checkmate-in-One'da %51 olmak üzere kayda değer performans artışları elde edildi. Ek analizler, BoT'un üstün genelleme yeteneği ve model sağlamlığını ortaya koyarken, ortalama olarak çoklu sorgu prompting yöntemlerinin (ör. tree/graph of thoughts) maliyetinin yalnızca %12'sini gerektirdiğini gösteriyor. Özellikle, Llama3-8B+BoT'un Llama3-70B modelini geride bırakma potansiyeline sahip olduğu bulundu. Proje şu bağlantıda yer alıyor: https://github.com/YangLing0818/buffer-of-thought-llm
> We introduce Buffer of Thoughts (BoT), a novel and versatile thought-augmented reasoning approach for enhancing accuracy, efficiency and robustness of large language models (LLMs). Specifically, we propose meta-buffer to store a series of informative high-level thoughts, namely thought-template, distilled from the problem-solving processes across various tasks. Then for each problem, we retrieve a relevant thought-template and adaptively instantiate it with specific reasoning structures to conduct efficient reasoning. To guarantee the scalability and stability, we further propose buffer-manager to dynamically update the meta-buffer, thus enhancing the capacity of meta-buffer as more tasks are solved. We conduct extensive experiments on 10 challenging reasoning-intensive tasks, and achieve significant performance improvements over previous SOTA methods: 11% on Game of 24, 20% on Geometric Shapes and 51% on Checkmate-in-One. Further analysis demonstrate the superior generalization ability and model robustness of our BoT, while requiring only 12% of the cost of multi-query prompting methods (e.g., tree/graph of thoughts) on average. Notably, we find that our Llama3-8B+BoT has the potential to surpass Llama3-70B model. Our project is available at: https://github.com/YangLing0818/buffer-of-thought-llm

Makale bağlantısı

https://arxiv.org/abs/2406.04271

Daha fazlasını okuyun

https://github.com/YangLing0818/buffer-of-thought-llm

https://x.com/omarsar0/status/1799113545696567416


SaySelf: Öz yansıtıcı gerekçelerle güven ifade etmeleri için LLM'leri eğitmek / SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales

Makale tanıtımı

LLM'lerin daha doğru, ince taneli güven tahminleri ve öz yansıtıcı gerekçeler ifade etmeyi öğrenmesini sağlayan bir eğitim çerçevesidir; birden fazla akıl yürütme zinciri arasındaki farkların özetlerini içeren bir veri kümesi üzerinde gözetimli ince ayar yapar, ardından güven tahminlerini kalibre etmek için pekiştirmeli öğrenme uygular; böylece LLM'nin doğru ve yüksek güvenli tahminler üretmesi teşvik edilirken, hatalı çıktılarda aşırı güven göstermesi cezalandırılır.
> A training framework to teach LLMs to express more accurate fine-grained confidence estimates and self-reflective rationales; it performs supervised finetuning on a dataset that contains summaries of the difference between multiple reasoning chains; reinforcement learning is then applied to calibrate confidence estimates, encouraging the LLM to produce accurate, high-confidence predictions and penalize overconfidence in erroneous outputs.

Makale özeti (Abstract)

Büyük dil modelleri (LLM'ler) sık sık hatalı veya uydurma bilgiler üretir ve genellikle güven düzeylerini belirtmez; bu da daha geniş çapta kullanılmalarını sınırlar. Önceki çalışmalar, doğrudan veya self-consistency prompting yoluyla ya da supervised fine-tuning için belirli veri kümeleri oluşturarak LLM'lerden güven düzeyi çıkarmaya çalıştı. Prompting tabanlı yaklaşımlar daha düşük performans gösterirken, eğitim tabanlı yaklaşımlar ikili ya da grup düzeyinde hatalı güven tahminleriyle sınırlı kalır. Bu çalışma, LLM'lere daha doğru ve ayrıntılı güven tahminleri ifade etmeyi öğreten bir eğitim çerçevesi olan gelişmiş SaySelf'i tanıtıyor. Ayrıca SaySelf, güven puanlarının ötesinde, LLM'leri parametrik bilgi boşluklarını açıkça belirleyen ve belirsizliklerini açıklayan öz-yansıtmalı gerekçeler üretmeye yönlendiren bir süreci başlatır. Bu, belirli bilgilere ilişkin belirsizliklerin doğal dil aracılığıyla bir LLM tarafından otomatik olarak özetlenmesiyle gerçekleştirilir. Özetleme, örneklenen birden fazla akıl yürütme zincirindeki tutarsızlıkların analizine dayanır ve ortaya çıkan veri supervised fine-tuning için kullanılır. Buna ek olarak, özenle tasarlanmış bir ödül fonksiyonuyla birlikte reinforcement learning kullanılarak güven tahminleri kalibre edilir; böylece LLM'lerin doğru ve yüksek güvenli tahminler sunması teşvik edilirken, hatalı çıktılardaki aşırı güven cezalandırılır. Dağılım içi ve dağılım dışı veri kümelerindeki deneysel sonuçlar, SaySelf'in güven kalibrasyon hatasını azaltmada ve görev performansını korumada etkili olduğunu gösteriyor. Ayrıca üretilen öz-yansıtmalı gerekçelerin makul olduğu ve kalibrasyona daha fazla katkı sağlayabildiği gösteriliyor. Kodlar https://github.com/xu1868/SaySelf adresinde herkese açık olarak yayımlanmıştır.
> Large language models (LLMs) often generate inaccurate or fabricated information and generally fail to indicate their confidence, which limits their broader applications. Previous work elicits confidence from LLMs by direct or self-consistency prompting, or constructing specific datasets for supervised finetuning. The prompting-based approaches have inferior performance, and the training-based approaches are limited to binary or inaccurate group-level confidence estimates. In this work, we present the advanced SaySelf, a training framework that teaches LLMs to express more accurate fine-grained confidence estimates. In addition, beyond the confidence scores, SaySelf initiates the process of directing LLMs to produce self-reflective rationales that clearly identify gaps in their parametric knowledge and explain their uncertainty. This is achieved by using an LLM to automatically summarize the uncertainties in specific knowledge via natural language. The summarization is based on the analysis of the inconsistency in multiple sampled reasoning chains, and the resulting data is utilized for supervised fine-tuning. Moreover, we utilize reinforcement learning with a meticulously crafted reward function to calibrate the confidence estimates, motivating LLMs to deliver accurate, high-confidence predictions and to penalize overconfidence in erroneous outputs. Experimental results in both in-distribution and out-of-distribution datasets demonstrate the effectiveness of SaySelf in reducing the confidence calibration error and maintaining the task performance. We show that the generated self-reflective rationales are reasonable and can further contribute to the calibration. The code is made public at https://github.com/xu1868/SaySelf.

Makale bağlantısı

https://arxiv.org/abs/2405.20974

Daha fazlası

https://github.com/xu1868/SaySelf

https://x.com/omarsar0/status/1797682549608833477


Büyük Dil Modellerinde Kategorik ve Hiyerarşik Kavramların Geometrisi / The Geometry of Categorical and Hierarchical Concepts in Large Language Models

Makale tanıtımı

Kategorik kavramların geometrik yapısını ve bunlar arasındaki hiyerarşik ilişkilerin LLM'lerde nasıl kodlandığını inceliyor; basit kategorik kavramların LLM'ler tarafından simpleksler olarak temsil edildiğini ve karmaşık kavramların, hiyerarşik yapıyı yansıtan simplekslerin doğrudan toplamlarından oluşturulan politoplar olarak temsil edildiğini ortaya koyuyor.
> Studies the geometry of categorical concepts and how the hierarchical relations between them are encoded in LLMs; finds that simple categorical concepts are represented as simplices by the LLMs and complex concepts are represented as polytopes constructed from direct sums of simplices, which reflect the hierarchical structure.

Makale özeti (Abstract)

Büyük dil modellerinin temsil uzaylarında anlamsal anlamın nasıl kodlandığını anlamak, yorumlanabilirliğin temel problemlerinden biridir. Bu makale, bu alandaki iki temel soruyu inceliyor. Birincisi, {'memeli', 'kuş', 'sürüngen', 'balık'} gibi kategorik kavramlar nasıl temsil ediliyor? İkincisi, kavramlar arasındaki hiyerarşik ilişkiler nasıl kodlanıyor? Örneğin, 'köpek'in bir 'memeli' türü olduğu bilgisi nasıl kodlanıyor? Bu sorulara yanıt vermek için doğrusal temsil hipotezinin nasıl genişletilebileceğini gösteriyorlar. Şaşırtıcı derecede basit bir yapı buluyorlar: basit kategorik kavramlar simpleksler olarak temsil ediliyor, hiyerarşik olarak ilişkili kavramlar tam olarak tanımladıkları bir anlamda ortogonal oluyor ve bunun sonucunda karmaşık kavramlar, hiyerarşik yapıyı yansıtacak şekilde simplekslerin doğrudan toplamlarından oluşturulan politoplar olarak temsil ediliyor. Bu kuramsal sonuçları Gemma büyük dil modeli üzerinde doğruluyor, WordNet verilerini kullanarak hiyerarşik olarak ilişkili 957 kavramın temsillerini tahmin ediyorlar.

Understanding how semantic meaning is encoded in the representation spaces of large language models is a fundamental problem in interpretability. In this paper, we study the two foundational questions in this area. First, how are categorical concepts, such as {'mammal', 'bird', 'reptile', 'fish'}, represented? Second, how are hierarchical relations between concepts encoded? For example, how is the fact that 'dog' is a kind of 'mammal' encoded? We show how to extend the linear representation hypothesis to answer these questions. We find a remarkably simple structure: simple categorical concepts are represented as simplices, hierarchically related concepts are orthogonal in a sense we make precise, and (in consequence) complex concepts are represented as polytopes constructed from direct sums of simplices, reflecting the hierarchical structure. We validate these theoretical results on the Gemma large language model, estimating representations for 957 hierarchically related concepts using data from WordNet.

Makale bağlantısı

https://arxiv.org/abs/2406.01506

Daha fazlası

https://x.com/omarsar0/status/1798010546522103898


Sadece göster, anlatma: Dil modellerini gösterilen geri bildirimle hizalama / Show, Don't Tell: Aligning Language Models with Demonstrated Feedback

Makale tanıtımı

Geri bildirim olarak çok az sayıda demo kullanarak LLM'leri belirli bir ortama uyarlayan bir yöntem öneriyor; LLM çıktıları kullanıcının gösterdiği davranışlarla hizalanıyor, farklı alanlarda ince ayarlı stil ve görev hizalaması öğrenebiliyor ve test edilen benchmark'larda few-shot prompting, SFT ve self-play yöntemlerinden daha iyi performans gösteriyor.

Proposes a method to align LLMs to a specific setting via a very small number of demonstrations as feedback; it aligns LLM outputs to a user’s demonstrated behaviors and can learn fine-grained style and task alignment across domains; outperforms few-shot prompting, SFT, and self-play methods on the tested benchmarks.

Makale özeti (Abstract)

Dil modelleri, çok sayıda kolektif sesi taklit edecek şekilde hizalandığı için, aslında hiç kimseyle tam olarak örtüşmeyen çıktılar üretir. LLM'leri genel amaçlı çıktılardan uzaklaştırmak supervised finetuning veya RLHF ile mümkündür, ancak yeni ve geçici görevler için aşırı büyük veri kümeleri gerektirir. Bunun yerine, çok az sayıda ($<10$) demoyu geri bildirim olarak kullanarak bir LLM'yi belirli bir ortama hizalamanın mümkün olduğunu savunuyorlar. Yöntemleri olan Demonstration ITerated Task Optimization (DITTO), dil modeli çıktılarını doğrudan kullanıcının gösterdiği davranışlarla hizalar. Online imitation learning fikirlerinden türetilen DITTO, kullanıcı demolarını LLM'nin ve ara checkpoint'lerinin çıktılarından daha tercih edilir kabul ederek çevrimiçi karşılaştırma verisini düşük maliyetle üretir. DITTO'nun haber yazıları, e-postalar ve blog yazıları gibi alanlar arasında ince ayarlı stil ve görev hizalaması öğrenme becerisini değerlendiriyorlar. Ayrıca katılımcılardan çeşitli demolar topladıkları bir kullanıcı çalışması da yürütüyorlar ($N=16$). Benchmark'lar ve kullanıcı çalışması genelinde, DITTO'nun kazanma oranlarının few-shot prompting, supervised fine-tuning ve diğer self-play yöntemlerini ortalama 19 puan geçtiğini buluyorlar. Demoları doğrudan geri bildirim olarak kullanarak DITTO, LLM'lerin etkili biçimde özelleştirilmesi için yeni bir yöntem sunuyor.

Language models are aligned to emulate the collective voice of many, resulting in outputs that align with no one in particular. Steering LLMs away from generic output is possible through supervised finetuning or RLHF, but requires prohibitively large datasets for new ad-hoc tasks. We argue that it is instead possible to align an LLM to a specific setting by leveraging a very small number ($<10$) of demonstrations as feedback. Our method, Demonstration ITerated Task Optimization (DITTO), directly aligns language model outputs to a user's demonstrated behaviors. Derived using ideas from online imitation learning, DITTO cheaply generates online comparison data by treating users' demonstrations as preferred over output from the LLM and its intermediate checkpoints. We evaluate DITTO's ability to learn fine-grained style and task alignment across domains such as news articles, emails, and blog posts. Additionally, we conduct a user study soliciting a range of demonstrations from participants ($N=16$). Across our benchmarks and user study, we find that win-rates for DITTO outperform few-shot prompting, supervised fine-tuning, and other self-play methods by an average of 19% points. By using demonstrations as feedback directly, DITTO offers a novel method for effective customization of LLMs.

Makale bağlantısı

https://arxiv.org/abs/2406.00888

Daha fazlası

https://x.com/arankomatsuzaki/status/1797833884463472653


LLM'lerin ölçeklenebilir otomatik hizalanmasına doğru: Bir derleme makalesi / Towards Scalable Automated Alignment of LLMs: A Survey

Makale tanıtımı

LLM’leri hizalamak için kullanılan yöntemlere genel bir bakış sunuyor ve şu 4 yönü inceliyor: 1) tümevarımsal önyargı yoluyla hizalama, 2) davranış taklidi yoluyla hizalama, 3) model geri bildirimi yoluyla hizalama, 4) çevre geri bildirimi yoluyla hizalama.
> Provides an overview of methods used for alignment of LLMs; explores the 4 following directions: 1) aligning through inductive bias, 2) aligning through behavior imitation, 3) aligning through model feedback, and 4) aligning through environment feedback.

Makale özeti (Abstract)

Hizalama, insan ihtiyaçlarını karşılayan büyük dil modelleri (LLM) oluşturmanın en kritik adımıdır. LLM’ler giderek insan yeteneklerini aşan bir düzeye doğru hızla geliştikçe, insan anotasyonuna dayanan geleneksel hizalama yöntemleri ölçeklenebilirlik gereksinimlerini giderek daha fazla karşılayamaz hale geliyor. Bu nedenle, otomatik hizalama sinyallerinin yeni kaynaklarını ve teknik yaklaşımlarını araştırmaya yönelik acil bir ihtiyaç bulunuyor. Bu makalede, son dönemde ortaya çıkan otomatik hizalama yöntemlerini sistematik olarak gözden geçirerek, LLM’lerin yetenekleri insanlarınkini aştığında etkili, ölçeklenebilir ve otomatik hizalamanın nasıl sağlanabileceğini incelemeyi amaçlıyoruz. Özellikle mevcut otomatik hizalama yöntemlerini, hizalama sinyallerinin kaynaklarına göre büyük ölçüde 4 ana kategoriye ayırıyor ve her kategorinin mevcut durumu ile gelişim potansiyelini tartışıyoruz. Ayrıca otomatik hizalamayı mümkün kılan temel mekanizmaları inceliyor, hizalamanın temel rolü açısından otomatik hizalama teknolojilerini uygulanabilir ve etkili kılan temel unsurları ele alıyoruz.
> Alignment is the most critical step in building large language models (LLMs) that meet human needs. With the rapid development of LLMs gradually surpassing human capabilities, traditional alignment methods based on human-annotation are increasingly unable to meet the scalability demands. Therefore, there is an urgent need to explore new sources of automated alignment signals and technical approaches. In this paper, we systematically review the recently emerging methods of automated alignment, attempting to explore how to achieve effective, scalable, automated alignment once the capabilities of LLMs exceed those of humans. Specifically, we categorize existing automated alignment methods into 4 major categories based on the sources of alignment signals and discuss the current status and potential development of each category. Additionally, we explore the underlying mechanisms that enable automated alignment and discuss the essential factors that make automated alignment technologies feasible and effective from the fundamental role of alignment.

Makale bağlantısı

https://arxiv.org/abs/2406.01252

Daha fazla bilgi

https://x.com/omarsar0/status/1798014572663583165


AgentGym: Çeşitli ortamlarda büyük dil modeli tabanlı ajanları evrimleştirmek / AgentGym: Evolving Large Language Model-based Agents across Diverse Environments

Makale tanıtımı

Geniş kapsamlı, gerçek zamanlı ve eşzamanlı ajan keşfi için çeşitli ortamları ve görevleri destekleyen yeni bir çerçeve; öz-evrim yeteneklerine sahip genel amaçlı bir LLM tabanlı ajan oluşturuyor ve görevler ile ortamlar genelinde daha önce görülen verilerin ötesindeki potansiyelini araştırıyor.
> A new framework featuring various environments and tasks for broad, real-time, and concurrent agent exploration; builds a generally capable LLM-based agent with self-evolution abilities and explores its potential beyond previously seen data across tasks and environments.

Makale özeti (Abstract)

Farklı görevleri yerine getirebilen ve çeşitli ortamlarda kendi kendini geliştirebilen genelist ajanlar oluşturmak, yapay zeka topluluğunun uzun vadeli hedeflerinden biridir. Büyük dil modelleri (LLM), genelleştirilmiş yetenekleri sayesinde bu tür ajanları oluşturmak için umut verici bir temel olarak görülmektedir. Mevcut yaklaşımlar ya LLM tabanlı ajanların uzmanlar tarafından sağlanan yörüngeleri adım adım taklit etmesini sağlayarak insan gözetimi gerektiriyor; bu da ölçeklemeyi zorlaştırıyor ve ortam keşfini kısıtlıyor; ya da ajanların izole ortamlarda keşfedip öğrenmesine izin vererek genelleme kabiliyeti sınırlı uzman ajanlar ortaya çıkarıyor. Bu makalede, kendi kendini geliştirme yeteneğine sahip genel amaçlı LLM tabanlı ajanlar oluşturma yolunda ilk adımı atıyoruz. Üç temel bileşen belirliyoruz: 1) ajanın keşif ve öğrenmesi için çeşitli ortamlar, 2) ajana temel yetenekler ve ön bilgi kazandıracak bir yörünge kümesi, 3) etkili ve ölçeklenebilir bir evrim yöntemi. Geniş kapsamlı, gerçek zamanlı, tek biçimli ve eşzamanlı ajan keşfi için çeşitli ortamlar ve görevler sunan yeni bir çerçeve olan AgentGym'i öneriyoruz. AgentGym ayrıca genişletilmiş talimatlar içeren bir veritabanı, bir benchmark paketi ve ortamlar genelinde yüksek kaliteli yörüngeler de içerir. Ardından, görevler ve ortamlar genelinde daha önce görülmüş verilerin ötesinde ajanın kendi kendini geliştirme potansiyelini incelemek için AgentEvol adlı yeni bir yöntem öneriyoruz. Deney sonuçları, evrim geçirmiş ajanların SOTA modellerle karşılaştırılabilir sonuçlar elde edebildiğini gösteriyor. Platform, veri kümesi, benchmark, checkpoint'ler ve algoritma uygulamalarını içeren AgentGym paketini yayımlıyoruz. AgentGym paketi https://github.com/WooooDyy/AgentGym adresinde bulunabilir.
> Farklı görevleri yerine getirebilen ve farklı ortamlarda kendi kendini geliştirebilen genelist ajanlar oluşturmak, yapay zeka topluluğunun uzun vadeli bir hedefidir. Büyük dil modelleri (LLM'ler), genelleştirilmiş yetenekleri nedeniyle bu tür ajanları inşa etmek için umut verici bir temel olarak kabul edilir. Mevcut yaklaşımlar ya LLM tabanlı ajanların uzmanlar tarafından sağlanan yörüngeleri adım adım taklit etmesini sağlar; bu da insan gözetimi gerektirir, ölçeklenmesi zordur ve ortam keşfini sınırlar; ya da ajanların izole ortamlarda keşfedip öğrenmesine izin verir ve bunun sonucunda genelleme kabiliyeti sınırlı uzman ajanlar ortaya çıkar. Bu makalede, kendi kendini geliştirme yeteneğine sahip genel kabiliyetli LLM tabanlı ajanlar inşa etme yolunda ilk adımı atıyoruz. Üçlü bir bileşen seti tanımlıyoruz: 1) ajanın keşif ve öğrenmesi için çeşitli ortamlar, 2) ajanlara temel yetenekler ve ön bilgi kazandıracak bir yörünge kümesi ve 3) etkili ve ölçeklenebilir bir evrim yöntemi. Geniş kapsamlı, gerçek zamanlı, tek formatlı ve eşzamanlı ajan keşfi için çeşitli ortamlar ve görevler sunan yeni bir çerçeve olan AgentGym'i öneriyoruz. AgentGym ayrıca genişletilmiş talimatlar içeren bir veritabanı, bir benchmark paketi ve ortamlar genelinde yüksek kaliteli yörüngeler içerir. Sonrasında, görevler ve ortamlar genelinde daha önce görülmüş verilerin ötesinde ajanların kendi kendini geliştirme potansiyelini araştırmak için AgentEvol adlı yeni bir yöntem öneriyoruz. Deneysel sonuçlar, evrimleşmiş ajanların SOTA modellerle kıyaslanabilir sonuçlara ulaşabildiğini göstermektedir. Platform, veri kümesi, benchmark, checkpoint'ler ve algoritma uygulamalarını içeren AgentGym paketini yayımlıyoruz. AgentGym paketi https://github.com/WooooDyy/AgentGym adresinde mevcuttur.

Makale bağlantısı

https://arxiv.org/abs/2406.04151

Daha fazlası

https://github.com/WooooDyy/AgentGym

https://x.com/arankomatsuzaki/status/1798904095669121443


Orijinal metin

https://nlp.elvissaravia.com/p/top-ml-papers-of-the-week-90f


Bu yazı GPT modeliyle derlenmiştir; hatalı kısımlar olabilir, bu nedenle lütfen aşağıdaki orijinal metne de göz atın! Okurken garip ya da yanlış bulduğunuz noktaları fark ederseniz, lütfen yorumlarda bildirin. 🤗

⚠️Reklam⚠️: 🔥PyTorch Kore Kullanıcı Grubu🇰🇷 tarafından derlenen bu yazıyı faydalı bulduysanız, üye olarak önemli yazıları e-posta💌 ile alabilirsiniz! (Varsayılan olarak Weekly'dir, ancak Daily olarak da değiştirilebilir.)

Henüz yorum yok.

Henüz yorum yok.