R2R V2 - üretime hazır açık kaynaklı RAG motoru
(github.com/SciPhi-AI)- Yerel LLM deneyleri ile üretim seviyesindeki Retrieval-Augmented Generation (RAG) sistemleri arasındaki boşluğu kapatmak için tasarlandı
- Geliştiriciler için RESTful API merkezli, kullanımı kolay, kapsamlı ve güncel bir RAG sistemi sunar
Başlıca özellikler
- Çok modlu destek:
.txt,.pdf,.json,.png,.mp3gibi çeşitli dosya biçimlerini destekler. - Hibrit arama: Alaka düzeyini artırmak için semantik ve anahtar kelime aramasını birleştirir.
- Graph RAG: İlişkileri otomatik olarak çıkarır ve bilgi grafiği oluşturur.
- Uygulama yönetimi: Belgeleri ve kullanıcıları verimli şekilde yönetir, zengin gözlemlenebilirlik ve analiz özellikleri sunar.
- İstemci-sunucu: RESTful API desteği sunar.
- Yapılandırılabilir: Sezgisel yapılandırma dosyaları kullanarak uygulamalar provision edilebilir.
- Genişletilebilir: Builder + Factory pattern sayesinde uygulamalar kolayca genişletilebilir.
- Dashboard: Kullanıcı dostu etkileşim için açık kaynaklı React+Next.js uygulaması olan R2R Dashboard'u sunar.
R2R Dashboard
Açık kaynaklı React+Next.js dashboard kullanarak R2R ile etkileşim kurulabilir. Başlamak için dashboard Cookbook'a bakılabilir.
1 yorum
Hacker News görüşleri
Veri çıkarımında doğruluk ve verimlilik: RAG sistemlerinde veri çıkarım süreci önemli bir zorluk. Geleneksel OCR yaklaşımı yetersiz kaldığı için doğruluk ve tutarlılığı artırmak adına multimodal LLM + OCR yaklaşımı kullanılıyor.
Benzer bir stack işletme deneyimi: 2 yıldır benzer bir stack işletiliyor; Pgvector, HyDe, web araması + belge araması gibi teknolojiler kullanılıyor. Loglar ve analizleri de içeren iyi bir dashboard mevcut.
Hızlı başlangıcın zorlukları: Hızlı başlangıç aslında o kadar da hızlı değil. Docker Compose ve Postgres image'ını içeren bir kurulum sunulmalı. Dashboard'u kullanmak için ayrı bir repo clone'lamak gerekmesi de zahmet yaratıyor.
Projenin karmaşıklığı: Proje çok sayıda bileşen içeriyor ama geliştirmeyi daha kolay hale getirmiyor. Bunun bir SDK mı yoksa uygulama koleksiyonu mu olduğu belirsiz. Tüm özelliklerin önizlenebilmesi için "1 tık" kurulum deneyimi sunulmalı.
Doğruluk doğrulaması: Yanıtların doğruluğunun nasıl doğrulanabileceğine dair soru var. Yanıtın nasıl üretildiğini izleyebilecek bir yöntem olup olmadığı merak ediliyor.
Veri toplamanın zorlukları: Birçok RAG projesinde veri toplama konusu düzgün çözülmüyor. Büyük miktarda HTML belgesinin sisteme toplu olarak nasıl aktarılabileceği soruluyor.
Multimodal veri toplama: Multimodal veri toplama sürecine dair daha ayrıntılı açıklama isteniyor. R2R'nin şu anda işleyebildiği veri türleri ve metin dışı veri türlerinin nasıl embedding'e dönüştürüldüğü soruluyor.
Geliştirme ekibi optimizasyonu: Sürecin geliştirme ekibi için nasıl daha hızlı ve daha optimize hale geldiğine dair açıklama isteniyor. MVP (minimum uygulanabilir ürün) geliştirme süresini hızlandırma potansiyeli yüksek.
Kaynak kodla çalışma: Kaynak kodu anlayabilen bir RAG çözümü aranıyor. Örneğin, "gönder" düğmesine tıklandığında çağrılan analiz event'ini anlayabilen bir özellik isteniyor.
Neo4j kullanımına karşı çıkış: Neo4j kullanılmak istenmiyor çünkü kaynak tüketimi yüksek.
Popüler sohbet frontend'leriyle entegrasyon: OpenWebUI gibi popüler sohbet frontend'leriyle entegrasyon olup olmadığı soruluyor.