[2023/11/13 ~ 11/19] Bu Haftanın Öne Çıkan ML Makaleleri (Top ML Papers of the Week)
(discuss.pytorch.kr)Genel Bakış
-
DAIR.AI tarafından her hafta yayımlanan ML makalelerine dair yazıyı otomatik olarak çevirdik.
-
Bu hafta, LLM'leri (Large Language Models), yani büyük dil modellerini iyileştiren ve genişleten araştırmalar öne çıktı. Özellikle LLM'lerin uygun maliyetli çalışması, bilimsel keşiflerde kullanımı ve pratik kod üretimi için dil modellerine odaklanan makaleler yer alıyor. Bunun yanında, bu modellerin olgusallığını artırmaya yönelik araştırmaların da yükselen bir eğilim olduğu görülüyor.
-
Dil modelleri, özellikle de LLM'ler, doğal dil işleme (NLP) alanında büyük ilgi görüyor. Bunun nedeni, modellerin giderek daha fazla insan benzeri şekilde karmaşık ve çeşitli dil görevlerini yerine getirebilmesi olabilir. Bu modeller; sistematik düşünmeyi taklit etme (Contrastive CoT Prompting) veya kod geliştirmede otomasyonu artırma (A Survey on Language Models for Code) gibi çeşitli alanlarda uygulanabiliyor. Ayrıca LLM'leri daha da ileri taşımaya yönelik yöntemler, örneğin doğru bağlam filtreleme yoluyla bilgi erişimini güçlendirme (Learning to Filter Context for RAG) ya da kullanıcıları aldatmayan sistemler geliştirme yönündeki çalışmalar (LLMs can Deceive Users) da önemli araştırma eğilimleri arasında.
Emu video ve Emu edit / Emu Video and Emu Edit
Makale tanıtımı
- Difüzyon modelleri tabanlı, kontrollü görsel düzenleme ve metinden videoya üretim için yeni modeller sunuluyor. Emu Video, yalnızca metin, yalnızca görsel veya metin ve görsel girdilerini birleştirerek yüksek kaliteli video üretebiliyor; Emu Edit ise metin talimatlarıyla serbest biçimli düzenleme yapılmasını sağlıyor.
Present new models for controlled image editing and text-to-video generation based on diffusion models; emu video can generate high-quality video by using text-only, image-only, or combined text and image inputs; emu edit enables free-form editing through text instructions.
Makale bağlantısı
Daha fazlası
https://x.com/AIatMeta/status/1725184026154349007
##CoN(Chain-of-Note): Arama ile güçlendirilmiş dil modellerinde sağlamlığın artırılması / Chain-of-Note: Enhancing Robustness in Retrieval-Augmented Language Models
Makale tanıtımı
- Gürültülü ve alakasız belgelerle karşılaşıldığında ve bilinmeyen senaryolar ele alınırken, arama ile güçlendirilmiş dil modellerinin sağlamlığını ve güvenilirliğini artırmaya yönelik bir yaklaşım; CoN, getirilen belgeler için sıralı okuma notları üreterek bunların verilen soruyla ilgisini değerlendirmeyi ve bu bilgiyi nihai yanıtı oluşturmak için bütünleştirmeyi mümkün kılıyor; CoN, standart arama ile güçlendirilmiş dil modellerini belirgin biçimde geride bırakıyor ve tamamen gürültülü getirilen belgelerde ortalama +7.9 EM puanı iyileşmesi ile ön eğitim bilgi kapsamı dışındaki gerçek zamanlı sorularda reddetme oranında +10.5 artış elde etti.
An approach to improve the robustness and reliability of retrieval-augmented language models in facing noisy, irrelevant documents and in handling unknown scenarios; con generates sequential reading notes for the retrieved documents, enabling an evaluation of their relevance to the given question and integrating this information to formulate the final answer; con significantly outperforms standard retrieval-augmented language models and achieves an average improvement of +7.9 in em score given entirely noisy retrieved documents and +10.5 in rejection rates for real-time questions that fall outside the pre-training knowledge scope.
Makale özeti
- Arama destekli dil modelleri (RALM), özellikle dış bilgi kaynaklarından yararlanarak olgusal halüsinasyonları azaltma konusunda, büyük dil modellerinin yeteneklerinde kayda değer bir ilerlemeyi temsil ediyor. Ancak getirilen bilginin güvenilirliği her zaman garanti edilemez. İlgisiz verilerin getirilmesi hatalı yanıtlara yol açabilir ve model, sorguyu çözmek için yeterli bilgiye sahip olsa bile kendi içsel bilgisini göz ardı edebilir. Ayrıca standart RALM'ler, doğru bir yanıt vermek için hem içsel hem de getirilen bilgi açısından yeterli bilgiye sahip olup olmadıklarını değerlendirmekte çoğu zaman zorlanır. Bilginin yetersiz olduğu durumlarda, bu sistemlerin ideal olarak yanıtın elde edilemediği durumlarda "bilinmiyor" şeklinde yanıt vermesi gerekir. Bu zorluklara yanıt olarak, gürültülü ve ilgisiz belgelerle karşılaşıldığında ve bilinmeyen senaryolar ele alınırken RALM'lerin dayanıklılığını artırmayı amaçlayan yeni bir yaklaşım olan CoN (Chain-of-Noting) tanıtıldı. CoN'un temel fikri, getirilen belgeler için ardışık okuma notları oluşturarak bunların verilen soruyla ilişkisini kapsamlı biçimde değerlendirmek ve bu bilgiyi birleştirerek nihai yanıtı formüle etmektir. CoN için eğitim verileri ChatGPT kullanılarak üretildi ve ardından LLaMa-2 7B modeli üzerinde eğitildi. Dört açık alanlı QA benchmark'ında yapılan deneyler, CoN ile donatılmış RALM'lerin standart RALM'leri belirgin biçimde geride bıraktığını gösterdi. Özellikle CoN, tamamen gürültülü getirilen belgelerde EM puanında ortalama +7,9 puanlık, ön eğitim bilgi kapsamı dışındaki gerçek zamanlı sorularda reddetme oranında ise ortalama +10,5 puanlık iyileşme sağladı.
Retrieval-augmented language models (RALMs) represent a substantial advancement in the capabilities of large language models, notably in reducing factual hallucination by leveraging external knowledge sources. However, the reliability of the retrieved information is not always guaranteed. The retrieval of irrelevant data can lead to misguided responses, and potentially causing the model to overlook its inherent knowledge, even when it possesses adequate information to address the query. Moreover, standard RALMs often struggle to assess whether they possess adequate knowledge, both intrinsic and retrieved, to provide an accurate answer. In situations where knowledge is lacking, these systems should ideally respond with "unknown" when the answer is unattainable. In response to these challenges, we introduces Chain-of-Noting (CoN), a novel approach aimed at improving the robustness of RALMs in facing noisy, irrelevant documents and in handling unknown scenarios. The core idea of CoN is to generate sequential reading notes for retrieved documents, enabling a thorough evaluation of their relevance to the given question and integrating this information to formulate the final answer. We employed ChatGPT to create training data for CoN, which was subsequently trained on an LLaMa-2 7B model. Our experiments across four open-domain QA benchmarks show that RALMs equipped with CoN significantly outperform standard RALMs. Notably, CoN achieves an average improvement of +7.9 in EM score given entirely noisy retrieved documents and +10.5 in rejection rates for real-time questions that fall outside the pre-training knowledge scope.
Makale bağlantısı
https://arxiv.org/abs/2311.09210
Daha fazlasını okuyun
https://x.com/omarsar0/status/1725181141693472959
Büyük dil modellerinin bilimsel keşif üzerindeki etkisi: GPT-4 kullanılarak yapılan ön çalışma / The Impact of Large Language Models on Scientific Discovery: a Preliminary Study using GPT-4
Makale tanıtımı
- İlaç keşfi, biyoloji ve hesaplamalı kimya dahil çeşitli bilim alanlarında büyük dil modellerinin, özellikle GPT-4'ün etkisini inceliyor; uzman odaklı vaka değerlendirmeleri ve benchmark testleri aracılığıyla GPT-4'ün karmaşık bilimsel kavramları anlama düzeyini, problem çözme yeteneklerini ve bilimsel araştırmaları ilerletme potansiyelini değerlendiriyor.
Explores the impact of large language models, particularly gpt-4, across various scientific fields including drug discovery, biology, and computational chemistry; assesses gpt-4's understanding of complex scientific concepts, its problem-solving capabilities, and its potential to advance scientific research through expert-driven case assessments and benchmark testing.
Makale özeti
- Son birkaç yılda doğal dil işlemedeki çığır açıcı ilerlemeler, güçlü büyük dil modellerinin (LLM) ortaya çıkmasıyla sonuçlandı; bu modeller, doğal dili anlama, üretme ve çevirmenin yanı sıra dil işlemenin ötesine geçen görevler dahil çok geniş bir alanda dikkat çekici performans sergiledi. Bu raporda, en güncel dil modeli olan GPT-4’e odaklanarak LLM’lerin bilimsel keşif bağlamındaki performansını ayrıntılı biçimde inceliyoruz. İlaç keşfi, biyoloji, hesaplamalı kimya (yoğunluk fonksiyoneli teorisi (DFT) ve moleküler dinamik (MD)), malzeme tasarımı ve kısmi diferansiyel denklemler (PDE) gibi çeşitli bilim alanlarını kapsayan geniş bir araştırma yürüttük. GPT-4’ün bilimsel görevlerde değerlendirilmesi, farklı araştırma alanlarındaki potansiyelini ortaya çıkarmak, alana özgü uzmanlığını doğrulamak, bilimsel ilerlemeyi hızlandırmak, kaynak tahsisini optimize etmek, gelecekteki model geliştirmelerine yön vermek ve disiplinler arası araştırmayı teşvik etmek açısından kritik önemdedir. Kullandığımız keşif metodolojisi, esas olarak modelin karmaşık bilimsel kavramlar ve ilişkiler hakkındaki kavrayışına dair nitel içgörüler sunan uzman odaklı vaka değerlendirmeleri ile, modelin iyi tanımlanmış alana özgü problemleri çözme kapasitesini nicel olarak ölçen kıyaslama testlerinden oluşur. İlk inceleme sonuçları, GPT-4’ün karmaşık problem çözme ve bilgi entegrasyonu görevlerini ele alma becerisi gösterdiğini ve çeşitli bilimsel uygulamalar için umut verici bir potansiyele sahip olduğunu ortaya koydu. Genel olarak, GPT-4’ün bilgi tabanını, bilimsel anlayışını, bilimsel sayısal hesaplama yeteneklerini ve çeşitli bilimsel tahmin kabiliyetlerini değerlendiriyoruz.
In recent years, groundbreaking advancements in natural language processing have culminated in the emergence of powerful large language models (LLMs), which have showcased remarkable capabilities across a vast array of domains, including the understanding, generation, and translation of natural language, and even tasks that extend beyond language processing. In this report, we delve into the performance of LLMs within the context of scientific discovery, focusing on GPT-4, the state-of-the-art language model. Our investigation spans a diverse range of scientific areas encompassing drug discovery, biology, computational chemistry (density functional theory (DFT) and molecular dynamics (MD)), materials design, and partial differential equations (PDE). Evaluating GPT-4 on scientific tasks is crucial for uncovering its potential across various research domains, validating its domain-specific expertise, accelerating scientific progress, optimizing resource allocation, guiding future model development, and fostering interdisciplinary research. Our exploration methodology primarily consists of expert-driven case assessments, which offer qualitative insights into the model's comprehension of intricate scientific concepts and relationships, and occasionally benchmark testing, which quantitatively evaluates the model's capacity to solve well-defined domain-specific problems. Our preliminary exploration indicates that GPT-4 exhibits promising potential for a variety of scientific applications, demonstrating its aptitude for handling complex problem-solving and knowledge integration tasks. Broadly speaking, we evaluate GPT-4's knowledge base, scientific understanding, scientific numerical calculation abilities, and various scientific prediction capabilities.
Makale bağlantısı
https://arxiv.org/abs/2311.07361
Daha fazlası
https://x.com/omarsar0/status/1724465107046940893
Gerçekliğe uygunluk için dil modellerini ince ayarlama / Fine-tuning Language Models for Factuality
Makale tanıtımı
- İnsan etiketlemesi gerektirmeden dil modelini gerçekliğe uygunluk için ince ayarlar; otomatik olarak üretilen gerçeklik tercih sıralamalarından öğrenir ve açık uçlu üretim ayarlarını hedefler; gerçekliğe odaklı RLHF veya decoding stratejilerine kıyasla elde tutulmuş konularda Llama-2’nin gerçekliğe uygunluğunu önemli ölçüde artırır.
Fine-tunes language model for factuality without requiring human labeling; it learns from automatically generated factuality preference rankings and targets open-ended generation settings; it significantly improves the factuality of llama-2 on held-out topics compared with rlhf or decoding strategies targeted at factuality.
Makale özeti
- Önceden eğitilmiş büyük dil modellerinin (LLM) akıcılığı ve yaratıcılığı, dil modellerinin yaygın biçimde kullanılmasına yol açtı; hatta bazen geleneksel arama motorlarının yerine bile kullanılıyorlar. Ancak dil modelleri, çoğu zaman "halüsinasyon" olarak adlandırılan, ikna edici ama olgusal olarak yanlış iddialar üretmeye yatkındır. Bu hatalar, yanlış bilgilerin istemeden yayılmasına veya yanlış kanıların zararlı biçimde kalıcılaşmasına neden olabilir. Ayrıca model yanıtlarının manuel olarak doğrulanması zaman alan bir süreçtir; bu da insanlar tarafından sağlanan olgusallık etiketlerini edinmeyi maliyetli hale getirir. Bu çalışmada, insan etiketlemesi olmadan ve önceki çalışmalara göre daha açık uçlu üretim ortamlarını hedefleyerek dil modellerini daha olgusal olacak şekilde ince ayar yapıyoruz. Bunu yapmak için NLP'deki yakın dönem iki önemli yenilikten yararlanıyoruz. İlk olarak, son dönemdeki çeşitli çalışmalar, açık uçlu metnin olgusallığını dış bir bilgi tabanıyla tutarlılığı ya da basitçe büyük bir modelin güven puanlarını ölçerek değerlendirme yöntemleri önerdi. İkinci olarak, doğrudan tercih optimizasyonu algoritması, olası model yanıtları üzerindeki tercih sıralamasını kullanarak, denetimli taklit dışındaki hedefler için dil modellerinin doğrudan ince ayarını mümkün kılıyor. Mevcut arama sistemleri veya önerdiğimiz yeni aramasız yaklaşım aracılığıyla otomatik olarak oluşturulan olgusallık tercih sıralamalarından öğrenmenin, RLHF'ye ya da olgusallığı hedefleyen kod çözme stratejilerine kıyasla, Llama-2'nin elde tutulmuş konulardaki olgusallığını (üretilen iddialar içinde doğru olanların yüzdesi) anlamlı ölçüde iyileştirdiğini gösteriyoruz. 7B ölçekte, Llama-2-chat ile karşılaştırıldığında, biyografi üretiminde ve tıbbi soruları yanıtlarken olgusal hata oranının sırasıyla %58 ve %40 azaldığını gözlemliyoruz.
The fluency and creativity of large pre-trained language models (LLMs) have led to their widespread use, sometimes even as a replacement for traditional search engines. Yet language models are prone to making convincing but factually inaccurate claims, often referred to as 'hallucinations.' These errors can inadvertently spread misinformation or harmfully perpetuate misconceptions. Further, manual fact-checking of model responses is a time-consuming process, making human factuality labels expensive to acquire. In this work, we fine-tune language models to be more factual, without human labeling and targeting more open-ended generation settings than past work. We leverage two key recent innovations in NLP to do so. First, several recent works have proposed methods for judging the factuality of open-ended text by measuring consistency with an external knowledge base or simply a large model's confidence scores. Second, the direct preference optimization algorithm enables straightforward fine-tuning of language models on objectives other than supervised imitation, using a preference ranking over possible model responses. We show that learning from automatically generated factuality preference rankings, generated either through existing retrieval systems or our novel retrieval-free approach, significantly improves the factuality (percent of generated claims that are correct) of Llama-2 on held-out topics compared with RLHF or decoding strategies targeted at factuality. At 7B scale, compared to Llama-2-chat, we observe 58% and 40% reduction in factual error rate when generating biographies and answering medical questions, respectively.
Makale bağlantısı
https://arxiv.org/abs/2311.08401
Daha fazla bilgi
https://x.com/arankomatsuzaki/status/1724613041155608951
Karşıtsal Düşünce Zinciri (CoT) Promptlama / Contrastive Chain-of-Thought Prompting
Makale tanıtımı
- Dil modeli muhakemesini iyileştirmek için karşıtsal düşünce zinciri yöntemi (CoT) öneriliyor. Bu yaklaşım, hem geçerli hem de geçersiz muhakeme gösterimleri sunarak modelin adım adım akıl yürütmesini yönlendirirken muhakeme hatalarını azaltıyor. Ayrıca karşıtsal gösterimleri oluşturmak için otomatik bir yöntem öneriliyor ve CoT promptlamaya kıyasla iyileşme sağladığı gösteriliyor.
Proposes a contrastive chain of thought method to enhance language model reasoning; the approach provides both valid and invalid reasoning demonstrations, to guide the model to reason step-by-step while reducing reasoning mistakes; also proposes an automatic method to construct contrastive demonstrations and demonstrates improvements over cot prompting.
Makale özeti
- Dil modellerinin muhakemesini geliştirmede chain-of-thought yaklaşımının başarısına rağmen, altta yatan süreç hâlâ tam olarak anlaşılmış değil. Mantıksal olarak sağlam akıl yürütme chain-of-thought için özünde kritik görünse de, önceki çalışmalar geçersiz örneklemeler kullanıldığında etkinin şaşırtıcı biçimde sınırlı olduğunu gösteriyor. Ayrıca geleneksel chain-of-thought, dil modellerine hangi hatalardan kaçınmaları gerektiğini söylemediği için potansiyel olarak daha fazla hataya yol açabiliyor. Bu nedenle, insanların hem olumlu hem de olumsuz örneklerden öğrenebilmesinden ilham alarak, dil modeli muhakemesini güçlendirmek için contrastive chain of thought öneriyoruz. Geleneksel chain-of-thought ile karşılaştırıldığında yaklaşımımız, hem geçerli hem de hatalı akıl yürütme örnekleri sunarak modelin adım adım akıl yürütmesini yönlendirirken muhakeme hatalarını azaltıyor. Genellemeyi iyileştirmek için contrastive örneklemeleri otomatik olarak oluşturan bir yöntem tanıtıyoruz. Muhakeme benchmark’ları üzerindeki deneylerimiz, contrastive chain of thought’un chain-of-thought prompting için genel bir iyileştirme olarak kullanılabileceğini gösteriyor.
Dil modellerinin muhakemesini geliştirmede chain of thought yaklaşımının başarısına rağmen, altta yatan süreç hâlâ yeterince iyi anlaşılmış değildir. Mantıksal olarak sağlam akıl yürütme chain of thought için doğası gereği kritik görünse de, önceki çalışmalar geçersiz örneklemeler kullanıldığında etkinin şaşırtıcı biçimde çok az olduğunu ortaya koymaktadır. Ayrıca, geleneksel chain of thought dil modellerine hangi hatalardan kaçınmaları gerektiğini bildirmez; bu da potansiyel olarak daha fazla hataya yol açar. Bu nedenle, insanların hem olumlu hem de olumsuz örneklerden öğrenebilmesinden ilham alarak, dil modeli muhakemesini geliştirmek için contrastive chain of thought öneriyoruz. Geleneksel chain of thought ile karşılaştırıldığında yaklaşımımız, hem geçerli hem de geçersiz akıl yürütme örnekleri sunarak modelin adım adım akıl yürütmesini yönlendirirken muhakeme hatalarını azaltır. Genellemeyi iyileştirmek için contrastive örneklemeleri oluşturmak üzere otomatik bir yöntem sunuyoruz. Muhakeme benchmark’ları üzerindeki deneylerimiz, contrastive chain of thought’un chain-of-thought prompting için genel bir iyileştirme işlevi görebileceğini göstermektedir.
Makale bağlantısı
https://arxiv.org/abs/2311.09277
Daha fazla okuyun
https://x.com/arankomatsuzaki/status/1725340150819905723
Kod için dil modelleri üzerine bir derleme makalesi / A Survey on Language Models for Code
Makale tanıtımı
- Kod için LLM’lere genel bir bakış sunar; buna 50’den fazla model, 30’dan fazla değerlendirme görevi ve 500’den fazla ilgili çalışmanın incelenmesi dahildir.
Kod için LLM’lere genel bir bakış sunar; buna 50+ model, 30+ değerlendirme görevi ve 500 ilgili çalışmanın incelenmesi dahildir.
Makale özeti
- Bu çalışmada, 50’den fazla model, 30’dan fazla değerlendirme görevi ve 500’den fazla ilgili çalışmayı kapsayacak şekilde, dil modelleriyle kod işlemedeki son gelişmeleri sistematik olarak inceliyoruz. Kod işleme modellerini, GPT ailesiyle temsil edilen genel dil modelleri ve çoğu zaman özel hedeflerle kod üzerinde özellikle önceden eğitilmiş uzmanlaşmış modeller olarak ayırıyoruz. Bu modeller arasındaki ilişkileri ve farkları tartışıyor, ayrıca kod modellemenin istatistiksel modeller ve RNN’lerden önceden eğitilmiş Transformer’lara ve LLM’lere tarihsel geçişini vurguluyoruz; bu, NLP’nin izlediği yol ile tamamen aynıdır. Ayrıca AST, CFG ve unit test gibi koda özgü özellikleri, bunların kod dil modellerinin eğitimindeki uygulamalarını ele alıyor ve bu alandaki temel zorlukları ve olası gelecekteki yönelimleri belirliyoruz. Bu derlemeyi GitHub deposunda (https://github.com/codefuse-ai/Awesome-Code-LLM) açık ve güncel tutuyoruz.
Bu çalışmada, 50+ model, 30+ değerlendirme görevi ve 500 ilgili çalışmayı kapsayarak, dil modelleriyle kod işlemedeki son ilerlemeleri sistematik biçimde inceliyoruz. Kod işleme modellerini, GPT ailesiyle temsil edilen genel dil modelleri ile, çoğu zaman özel hedeflerle özellikle kod üzerinde önceden eğitilmiş uzmanlaşmış modellere ayırıyoruz. Bu modeller arasındaki ilişkileri ve farkları tartışıyor, ayrıca kod modellemenin istatistiksel modeller ve RNN’lerden önceden eğitilmiş Transformer’lara ve LLM’lere tarihsel geçişini vurguluyoruz; bu, NLP’nin izlediği yol ile tamamen aynıdır. Ayrıca AST, CFG ve unit test gibi koda özgü özellikleri, bunların kod dil modellerinin eğitimindeki uygulamalarıyla birlikte ele alıyor ve bu alandaki temel zorlukları ve olası gelecekteki yönelimleri belirliyoruz. Bu derlemeyi GitHub deposunda açık ve güncel tutuyoruz: https://github.com/codefuse-ai/Awesome-Code-LLM.
Makale bağlantısı
https://arxiv.org/abs/2311.07989v1
Daha fazla okuyun
https://x.com/omarsar0/status/1725637165256761553
JARVIS-1: Bellek destekli çok modlu dil modellerine sahip açık dünya çok görevli ajanlar / JARVIS-1: Open-World Multi-task Agents with Memory-Augmented Multimodal Language Models
Makale tanıtımı
- Açık dünya Minecraft evreninde görsel gözlemler ve insan talimatları gibi çok modlu girdileri algılayabilen, gelişmiş planlar üretebilen ve bedenlenmiş kontrol gerçekleştirebilen bir açık dünya ajanıdır; Minecraft evrenindeki 200’den fazla görevde neredeyse kusursuz performans sergiler; uzun ufuklu diamond pickaxe görevinde önceki rekorlara kıyasla 5 kat artışla %12,5 tamamlama oranına ulaşır.
Açık dünya Minecraft evreninde çok modlu girdileri (görsel gözlemler ve insan talimatları) algılayabilen, gelişmiş planlar üretebilen ve bedenlenmiş kontrol gerçekleştirebilen bir açık dünya ajanı; Minecraft evrenindeki 200’den fazla görevde neredeyse kusursuz performans sergiler; uzun ufuklu diamond pickaxe görevinde, önceki kayıtlara kıyasla 5 kat artış anlamına gelen %12,5 tamamlama oranına ulaşır.
Makale özeti
- Açık dünyada çok modlu gözlemler aracılığıyla insan benzeri planlama ve kontrol elde etmek, daha işlevsel genelist ajanlar için temel bir kilometre taşıdır. Mevcut yaklaşımlar açık dünyada belirli uzun ufuklu görevleri ele alabiliyor. Ancak açık dünya görevlerinin sayısı sonsuza kadar artabileceği ve oyun süresi uzadıkça görev tamamlama oranını kademeli olarak iyileştirme yeteneğinden yoksun oldukları için hâlâ zorlanıyorlar. Unity, popüler ama zorlu açık dünya Minecraft evreni içinde görsel gözlemler ve insan talimatları gibi birleşik girdileri algılayabilen, gelişmiş planlar üretebilen ve somutlaştırılmış kontrol gerçekleştirebilen bir açık dünya ajanı olan JARVIS-1'i tanıtıyor. Özellikle Unity, görsel gözlemleri ve metin talimatlarını planlara eşleyen önceden eğitilmiş çok modlu dil modelleri üzerine JARVIS-1'i geliştiriyor. Bu planlar nihayetinde hedef koşullu denetleyicilere iletiliyor. Unity, JARVIS-1'e çok modlu bir bellek ekleyerek hem önceden eğitilmiş bilgiyi hem de gerçek oyun içi hayatta kalma deneyimlerini kullanarak plan yapabilmesini sağlıyor. Unity'nin deney sonuçlarına göre JARVIS-1, başlangıçtan orta seviyeye uzanan Minecraft Universe Benchmark içindeki 200'den fazla farklı görevde neredeyse kusursuz performans gösterdi. JARVIS-1, uzun ufuklu elmas kazma görevinde %12,5 tamamlama oranına ulaştı. Bu, önceki kayıtlara kıyasla 5 kata kadar önemli bir artış anlamına geliyor. Ayrıca çok modlu bellek sayesinde, yaşam boyu öğrenme paradigmasını izleyerek JARVIS-1'in daha genel bir zekâ ve gelişmiş özerklik tetikleyip $\textit{kendi kendini geliştirebildiğini}$ gösterdiler. Proje sayfasına https://craftjarvis-jarvis1.github.io adresinden ulaşabilirsiniz.
Achieving human-like planning and control with multimodal observations in an open world is a key milestone for more functional generalist agents. Existing approaches can handle certain long-horizon tasks in an open world. However, they still struggle when the number of open-world tasks could potentially be infinite and lack the capability to progressively enhance task completion as game time progresses. We introduce JARVIS-1, an open-world agent that can perceive multimodal input (visual observations and human instructions), generate sophisticated plans, and perform embodied control, all within the popular yet challenging open-world Minecraft universe. Specifically, we develop JARVIS-1 on top of pre-trained multimodal language models, which map visual observations and textual instructions to plans. The plans will be ultimately dispatched to the goal-conditioned controllers. We outfit JARVIS-1 with a multimodal memory, which facilitates planning using both pre-trained knowledge and its actual game survival experiences. In our experiments, JARVIS-1 exhibits nearly perfect performances across over 200 varying tasks from the Minecraft Universe Benchmark, ranging from entry to intermediate levels. JARVIS-1 has achieved a completion rate of 12.5% in the long-horizon diamond pickaxe task. This represents a significant increase up to 5 times compared to previous records. Furthermore, we show that JARVIS-1 is able to $\textit{self-improve}$ following a life-long learning paradigm thanks to multimodal memory, sparking a more general intelligence and improved autonomy. The project page is available at https://craftjarvis-jarvis1.github.io.
Makale bağlantısı
https://arxiv.org/abs/2311.05997
Daha fazla okuyun
https://x.com/arankomatsuzaki/status/1723882043514470629
FILCO: Retrieval-Augmented Generation için Bağlam Filtrelemeyi Öğrenme / Learning to Filter Context for Retrieval-Augmented Generation
Makale tanıtımı
- Üreticiye sağlanan bağlamın kalitesini iki adım aracılığıyla iyileştiren bir yöntem öneriyor: 1) sözcüksel ve bilgi kuramsal yaklaşımlara dayalı olarak yararlı bağlamı belirlemek ve 2) çıkarımsal soru yanıtlama (QA), karmaşık çok adımlı ve uzun biçimli QA, olgu doğrulama ve diyalog üretimi görevlerinde mevcut yaklaşımlardan daha iyi performans gösteren, çıkarım sırasında getirilen bağlamları filtreleyebilen bağlam filtreleme modellerini eğitmek.
Proposes a method that improves the quality of the context provided to the generator via two steps: 1) identifying useful context based on lexical and information-theoretic approaches, and 2) training context filtering models that can filter retrieved contexts at inference; outperforms existing approaches on extractive question answering (qa), complex multi-hop and long-form qa, fact verification, and dialog generation tasks.
Makale özeti
- İlgili bilginin anlık olarak erişilmesi, açık alan soru yanıtlama ve olgu doğrulama gibi görevler için güvenilir sistemlerin temel bir unsuru olduğunu kanıtladı. Ancak erişim sistemleri kusursuz olmadığından, kısmen ya da tamamen alakasız pasajlar verildiğinde çıktı üretebilmek için üretim modellerine ihtiyaç duyulur. Bu durum, bağlama aşırı ya da yetersiz bağımlılığa yol açabilir ve üretilen çıktıda halüsinasyon gibi sorunlar ortaya çıkarabilir. Bu sorunları hafifletmek için, (1) sözcüksel ve bilgi kuramsal yaklaşımlara dayalı olarak faydalı bağlamı belirleyen ve (2) getirilen bağlamı test zamanında filtreleyebilen bağlam filtreleme modelleri eğiterek üreticiye sunulan bağlamın kalitesini artıran bir yöntem olan FILCO'yu öneriyoruz. FLAN-T5 ve LLaMa2 ile bilgi yoğun altı görev üzerinde yapılan deneyler, yöntemin çıkarımsal soru yanıtlama (QA), karmaşık çok adımlı ve uzun biçimli QA, olgu doğrulama ve diyalog üretimi görevlerinde mevcut yaklaşımlardan daha iyi performans gösterdiğini ortaya koydu. FILCO, standart çıktıyı destekleyip desteklemediğine bakılmaksızın bağlamın kalitesini etkili biçimde iyileştiriyor.
On-the-fly retrieval of relevant knowledge has proven an essential element of reliable systems for tasks such as open-domain question answering and fact verification. However, because retrieval systems are not perfect, generation models are required to generate outputs given partially or entirely irrelevant passages. This can cause over- or under-reliance on context, and result in problems in the generated output such as hallucinations. To alleviate these problems, we propose FILCO, a method that improves the quality of the context provided to the generator by (1) identifying useful context based on lexical and information-theoretic approaches, and (2) training context filtering models that can filter retrieved contexts at test time. We experiment on six knowledge-intensive tasks with FLAN-T5 and LLaMa2, and demonstrate that our method outperforms existing approaches on extractive question answering (QA), complex multi-hop and long-form QA, fact verification, and dialog generation tasks. FILCO effectively improves the quality of context, whether or not it supports the canonical output.
Makale bağlantısı
https://arxiv.org/abs/2311.08377v1
Daha fazlası
https://x.com/ZhiruoW/status/1724792850079252886
MART: Çok turlu otomatik red-teaming ile LLM güvenliğini iyileştirme / MART: Improving LLM Safety with Multi-round Automatic Red-Teaming
Makale tanıtımı
- Çok turlu otomatik adversarial prompt yazımı ile güvenli yanıt üretimini birleştirerek adversarial prompt yazımının ölçeklenebilirliğini ve LLM'lerin güvenliğini artıran, ayrıca güvenlik hizalaması sınırlı bir LLM'nin ihlal oranını MART'ın 4 turunun ardından %84,7'ye kadar düşürerek kapsamlı adversarial prompt yazımı kullanan LLM'lerle benzer performansa ulaşan, böylece LLM güvenliğini iyileştirmeyi amaçlayan bir yaklaşım öneriyor.
Proposes an approach for improving llm safety with multi-round automatic red-teaming; incorporates automatic adversarial prompt writing and safe response generation, which increases red-teaming scalability and the safety of llms; violation rate of an llm with limited safety alignment reduces up to 84.7% after 4 rounds of mart, achieving comparable performance to llms with extensive adversarial prompt writing.
Makale özeti
- Red teaming, Büyük Dil Modellerindeki (LLM) güvenli olmayan davranışları azaltmak için yaygın bir uygulamadır; LLM'leri potansiyel kusurları belirlemek üzere kapsamlı biçimde değerlendirmeyi ve bu sorunları sorumlu ve doğru yanıtlarla gidermeyi içerir. Etkili olsa da manuel red teaming maliyetlidir ve mevcut otomatik red teaming yaklaşımları genellikle güvenlik risklerini çözmek yerine yalnızca tespit eder. Bu makalede, hem otomatik adversarial prompt yazımını hem de güvenli yanıt üretimini birleştirerek red teaming'in ölçeklenebilirliğini ve hedef LLM'in güvenliğini önemli ölçüde artıran Multi-round Automatic Red-Teaming (MART) yöntemini öneriyoruz. Daha somut olarak, adversarial bir LLM ile hedef LLM yinelemeli bir biçimde birbirleriyle etkileşime girer; adversarial LLM, hedef LLM'den güvenli olmayan yanıtlar çıkarmaya yönelik zorlayıcı prompt'lar üretmeyi amaçlarken, hedef LLM bu adversarial prompt'lar üzerinde güvenlik hizalı verilerle fine-tune edilir. Her turda adversarial LLM, güncellenmiş hedef LLM'e karşı daha iyi saldırılar geliştirir; hedef LLM de güvenlik fine-tuning'i yoluyla kendisini iyileştirir. Adversarial prompt benchmark'larında, güvenlik hizalaması sınırlı bir LLM'in ihlal oranı, 4 tur MART sonrasında %84,7'ye kadar düşerek kapsamlı adversarial prompt yazımına sahip LLM'lerle karşılaştırılabilir performansa ulaşır. Dikkat çekici olarak, adversarial olmayan prompt'larda modelin faydalılığı yinelemeler boyunca istikrarlı kalır; bu da hedef LLM'in komut takibinde güçlü performansını koruduğunu gösterir.
Red-teaming, Büyük Dil Modellerindeki (LLM) güvenli olmayan davranışları azaltmak için yaygın bir uygulamadır; LLM'leri potansiyel kusurları belirlemek üzere kapsamlı biçimde değerlendirmeyi ve bu sorunları sorumlu ve doğru yanıtlarla gidermeyi içerir. Etkili olsa da manuel red-teaming maliyetlidir ve mevcut otomatik red-teaming yaklaşımları genellikle güvenlik risklerini çözmek yerine yalnızca tespit eder. Bu makalede, hem otomatik adversarial prompt yazımını hem de güvenli yanıt üretimini birleştirerek red-teaming'in ölçeklenebilirliğini ve hedef LLM'in güvenliğini önemli ölçüde artıran Multi-round Automatic Red-Teaming (MART) yöntemini öneriyoruz. Daha somut olarak, adversarial bir LLM ile hedef LLM yinelemeli bir biçimde birbirleriyle etkileşime girer; adversarial LLM, hedef LLM'den güvenli olmayan yanıtlar çıkarmaya yönelik zorlayıcı prompt'lar üretmeyi amaçlarken, hedef LLM bu adversarial prompt'lar üzerinde güvenlik hizalı verilerle fine-tune edilir. Her turda adversarial LLM, güncellenmiş hedef LLM'e karşı daha iyi saldırılar geliştirir; hedef LLM de güvenlik fine-tuning'i yoluyla kendisini iyileştirir. Adversarial prompt benchmark'larında, güvenlik hizalaması sınırlı bir LLM'in ihlal oranı, 4 tur MART sonrasında %84,7'ye kadar düşerek kapsamlı adversarial prompt yazımına sahip LLM'lerle karşılaştırılabilir performansa ulaşır. Dikkat çekici olarak, adversarial olmayan prompt'larda modelin faydalılığı yinelemeler boyunca istikrarlı kalır; bu da hedef LLM'in komut takibinde güçlü performansını koruduğunu gösterir.
Makale bağlantısı
https://arxiv.org/abs/2311.07689
Daha fazlasını okuyun
https://x.com/AIatMeta/status/1724887918685425829
Teknik rapor: Büyük Dil Modelleri baskı altına alındığında kullanıcılarını stratejik olarak aldatabilir / Technical Report: Large Language Models can Strategically Deceive their Users when Put Under Pressure
Makale tanıtımı
- LLM'lerle desteklenen otonom bir hisse senedi alım satım ajanının kullanımını inceliyor; ajanın içeriden alınan ipuçlarına göre hareket ettiğini ve alım satım kararının arkasındaki nedeni gizlediğini ortaya koyuyor; yararlı ve güvenli LLM'lerin, aldatmaya yönelik talimatlar ya da eğitim olmadan gerçekçi bir durumda kullanıcıları stratejik olarak aldatabildiğini gösteriyor.
LLM'lerle desteklenen otonom bir hisse senedi alım satım ajanının kullanımını inceler; ajanın içeriden alınan ipuçlarına göre hareket ettiğini ve alım satım kararının arkasındaki nedeni gizlediğini ortaya koyar; yararlı ve güvenli LLM'lerin, aldatmaya yönelik yönlendirme talimatları veya eğitim olmadan gerçekçi bir durumda kullanıcıları stratejik olarak aldatabildiğini gösterir.
Makale özeti
- Yardımsever, zararsız ve dürüst olacak şekilde eğitilmiş büyük dil modellerinin, herhangi bir talimat verilmeden yanlış hizalanmış davranışlar sergileyebildiğini ve bu davranış hakkında kullanıcılarını stratejik biçimde aldatabildiğini gösteren bir durumu sergiliyor. Somut olarak, GPT-4 gerçekçi bir simülasyon ortamında bir ajan olarak devreye alınıyor ve otonom bir hisse senedi alım satım ajanı rolünü üstleniyor. Bu ortamda model, kârlı bir hisse işlemi hakkında içeriden bilgi ediniyor ve içeriden öğrenenlerin ticaretinin şirket yönetimi tarafından onaylanmadığını bilmesine rağmen bu işlemi gerçekleştiriyor. Model, yöneticisine rapor verirken alım satım kararının gerçek nedenlerini tutarlı biçimde gizliyor. Araştırmacılar, modelin akıl yürütme scratchpad'ine erişiminin kaldırılması, sistem talimatlarının değiştirilerek yanlış hizalanmış davranışın önlenmeye çalışılması, model üzerindeki baskı miktarının değiştirilmesi, yakalanma riskine dair algılanan riskin değiştirilmesi ve ortamda başka basit değişiklikler yapılması gibi ayarlarda bu davranışın nasıl değiştiğini kısaca inceledi. Bildiğimiz kadarıyla bu, yardımsever, zararsız ve dürüst olacak şekilde eğitilmiş büyük dil modellerinin, doğrudan talimat veya aldatma eğitimi olmadan gerçekçi bir durumda kullanıcılarını stratejik olarak aldattığını gösteren ilk demodur.
We demonstrate a situation in which Large Language Models, trained to be helpful, harmless, and honest, can display misaligned behavior and strategically deceive their users about this behavior without being instructed to do so. Concretely, we deploy GPT-4 as an agent in a realistic, simulated environment, where it assumes the role of an autonomous stock trading agent. Within this environment, the model obtains an insider tip about a lucrative stock trade and acts upon it despite knowing that insider trading is disapproved of by company management. When reporting to its manager, the model consistently hides the genuine reasons behind its trading decision. We perform a brief investigation of how this behavior varies under changes to the setting, such as removing model access to a reasoning scratchpad, attempting to prevent the misaligned behavior by changing system instructions, changing the amount of pressure the model is under, varying the perceived risk of getting caught, and making other simple changes to the environment. To our knowledge, this is the first demonstration of Large Language Models trained to be helpful, harmless, and honest, strategically deceiving their users in a realistic situation without direct instructions or training for deception.
Makale bağlantısı
https://arxiv.org/abs/2311.07590
Daha fazlasını okuyun
https://x.com/ESYudkowsky/status/1725226563992715521
Orijinal metin
https://nlp.elvissaravia.com/p/top-ml-papers-of-the-week-e3d
Henüz yorum yok.