Büyük Dil Modelleri için Retrieval-Augmented Generation (RAG) teknolojisinin güncel durumu

(discuss.pytorch.kr)

16 puan yazan ninebow 2024-01-03 | 2 yorum | WhatsApp'ta paylaş

PyTorchKR

LLM'lerin popülerliğiyle birlikte RAG'e olan ilgi de artıyor. PyTorch Kore Kullanıcı Topluluğu, geçen 12/18~24 döneminin önemli ML makaleleri içinde tanıtılan RAG teknolojisine dair derleme makalesini özetledi.
İçerik biraz uzun olduğu için iki yazı olarak yayımlandı; 1. bölümde RAG teknolojisinin paradigmaları, 2. bölümde ise temel bileşenler, değerlendirme ve gelecekteki araştırma konuları ele alındı.

Aşağıda, içindekiler temel alınarak yalnızca ana noktalar derlenmiştir

Retrieval-Augmented Generation (RAG) teknolojisine giriş

Büyük dil modelleri (LLM), etkileyici yetenekler sergilese de gerçek kullanım için halüsinasyon, bilginin yavaş güncellenmesi ve yanıtların şeffaf olmaması gibi sorunların aşılması gerekir. RAG (Retrieval-Augmented Generation), bu sorunları çözmek için önerilen bir tekniktir.

RAG, büyük dil modellerinde (LLM) bir soruya yanıt ya da metin üretmeden önce geniş bir belge kümesinden ilgili bilgileri getirip bunları yanıt üretiminde kullanan bir yöntemdir. Bu yaklaşım, LLM'lerin mevcut sorunları olan bilginin güncelliğini yitirmesi, belirli alanlarda bilgi eksikliği ve yanıtların yeterince şeffaf olmaması gibi konuları çözmeye odaklanır.

Bu tür bir RAG, yanıt doğruluğunu önemli ölçüde artırır ve özellikle bilgi yoğun görevlerde modelin halüsinasyonlarını azaltmaya yardımcı olur. Kullanıcılar kaynak gösterilen yanıtların doğruluğunu doğrulayabilir; bu da model çıktısına duyulan güveni artırır. Ayrıca bilgi güncelleme ve belirli alan bilgilerini sisteme dahil etme açısından da elverişlidir.

RAG dışında, büyük dil modellerinin belirli bilgilere odaklanmasını sağlamak için fine-tuning de kullanılabilir. Ancak bu tür fine-tuning, gerçek zamanlı güncellenen bilgileri yansıtmakta zaman alır ve modeli yeniden eğitmek için ek kaynak gerektirir. Buna karşılık RAG, LLM'e belirli sorgular için bilgi arayabileceği bir 'başvuru kitabı' sağlamak gibidir.

RAG'in 3 ana paradigması - Genel bakış

RAG teknolojisinin araştırma paradigmaları zaman içinde sürekli gelişmektedir. Başlıca paradigmalar Naive RAG, Advanced RAG ve Modular RAG olmak üzere üçe ayrılır. İlk dönemlerdeki Naive RAG maliyet açısından verimliydi ve yalnızca LLM kullanmaktan daha iyi performans gösteriyordu, ancak birçok dezavantajı vardı. Advanced RAG ve Modular RAG'in ortaya çıkışı, Naive RAG'in belirli kusurlarını gidermeye yöneliktir.

RAG'in 3 ana paradigması - Temel RAG (Naive RAG)

Naive RAG, RAG araştırmalarındaki erken dönem metodolojileri ifade eder ve geleneksel indeksleme, retrieval ve generation süreçlerini içerir. Temel olarak basit retrieval ve generation yöntemlerine odaklanır; bu nedenle RAG'in temel kavram ve ilkelerini açıklamak açısından önemlidir.

Ancak düşük retrieval doğruluğu, düşük yanıt üretim kalitesi ve augmentation sürecindeki zorluklar; gereksiz tekrarlar, hatalı bilgiler ve yanlış bağlamların entegrasyonu gibi sorunlara yol açabilir. Bu nedenle karmaşık veya zorlu senaryolarda Naive RAG kullanımı uygun olmayabilir.

RAG'in 3 ana paradigması - Gelişmiş RAG (Advanced RAG)

Advanced RAG, Naive RAG'in eksik yönlerini geliştirmek için oluşturulmuş bir paradigmadır. Temelde retrieval ve generation kalitesini artırmaya yönelik retrieval öncesi ve sonrası yöntemleri içerir. Advanced RAG genel olarak üç aşamaya ayrılabilir: retrieval öncesi süreç (Pre-Retrieval Process), retrieval sonrası süreç (Post-Retrieval Process) ve RAG pipeline optimizasyonu (RAG Pipeline Optimization):

RAG'in 3 ana paradigması - Modüler RAG (Modular RAG)

Modüler RAG, Advanced RAG'in gelişmiş bir biçimidir; mevcut RAG çerçevesini bir adım ileri taşıyarak çeşitli modülleri ve işlevleri entegre eder, böylece daha fazla çeşitlilik ve esneklik sunar. Bu yaklaşım, RAG sistemlerinin farklı senaryolara ve gereksinimlere uyarlanabilmesini sağlayan çeşitli yeni modüller ve kalıplar içerir.

RAG teknolojisinin temel bileşenleri: Retriever

Retriever, RAG kısaltmasının başındaki R harfini temsil edecek kadar sistem içinde kritik bir bilgi bulma rolü üstlenir. Büyük veri kümeleri içinde ilgili bilgiyi bulur ve metin üretimi için gerekli verileri hazırlar. Bu retriever'lar, LLM'lerin genel bilgisi ile güncel ve bağlama uygun doğru bilgi ihtiyacı arasındaki boşluğu kapatmak için kullanılır. Bu özellikle gerçek zamanlı veri, belirli alan uzmanlığı veya doğruluk kontrolünün gerektiği senaryolarda önemlidir.

RAG teknolojisinin temel bileşenleri: Generator

Yukarıda ele alınan Retriever'ın rolü, kullanıcı girdisinden aday belgeleri çıkarmaktı; Generator'ın rolü ise getirilen sonuçları kullanarak kullanıcıya sunulacak yanıtı oluşturmaktır. Getirilen bilgiyi etkili biçimde kullanıp doğru ve yüksek ilgiliğe sahip yanıtlar üretmek için, bilgiyi sıkıştırma ve yeniden sıralama gibi son işleme adımları ile girdi verisine uyum sağlayan optimizasyon süreçleri uygulanır.

RAG teknolojisinin temel bileşenleri: Augmentation Methods

Bu bölümde RAG'deki augmentation yöntemlerine şu üç açıdan bakılacaktır.

augmentation aşaması (the stage of augmentation)
veri kaynaklarının augmentation'ı (augmentation data sources)
augmentation süreci (the process of augmentation)

RAG değerlendirmesi (RAG Evaluation)

RAG değerlendirmesi (RAG Evaluation), RAG'in ne kadar etkili çalıştığını ölçmektir. Değerlendirme genel olarak iki türe ayrılır: biri retriever veya generator gibi her bir modüle yönelik bağımsız değerlendirme (independent evaluation), diğeri ise girdiden çıktıya tüm süreci inceleyen end-to-end evaluation'dır (uçtan uca değerlendirme). Her bir değerlendirme yöntemi, değerlendirme sırasında kullanılan metrikler (metric) ve yararlanılabilecek framework'ler hakkında bilgi verilmektedir.

RAG'in gelecek görünümü (Future Prospects)

RAG'in dikey optimizasyonu ve yatay genişlemesi ile RAG ekosistemine ilişkin konular ele alınmaktadır.

⚠️Reklam: PyTorch Kore Kullanıcı Topluluğu'nun derlediği bu yazıyı faydalı buldunuz mu? Üye olursanız, önemli yazıları e-postayla gönderiyoruz! (Varsayılan ayar Weekly'dir, ancak Daily olarak değiştirebilirsiniz.)

2 yorum

959ma 2024-01-04

Bu değerli kaynağı paylaştığınız için teşekkür ederim.

ninebow 2024-01-04

Ah, okuduğunuz için teşekkür ederim!
Okurken garip ya da hatalı bulduğunuz bir kısım olursa lütfen bana bildirin. ^^;