5 puan yazan GN⁺ 2024-06-28 | 1 yorum | WhatsApp'ta paylaş
  • Yerel LLM deneyleri ile üretim seviyesindeki Retrieval-Augmented Generation (RAG) sistemleri arasındaki boşluğu kapatmak için tasarlandı
  • Geliştiriciler için RESTful API merkezli, kullanımı kolay, kapsamlı ve güncel bir RAG sistemi sunar

Başlıca özellikler

  • Çok modlu destek: .txt, .pdf, .json, .png, .mp3 gibi çeşitli dosya biçimlerini destekler.
  • Hibrit arama: Alaka düzeyini artırmak için semantik ve anahtar kelime aramasını birleştirir.
  • Graph RAG: İlişkileri otomatik olarak çıkarır ve bilgi grafiği oluşturur.
  • Uygulama yönetimi: Belgeleri ve kullanıcıları verimli şekilde yönetir, zengin gözlemlenebilirlik ve analiz özellikleri sunar.
  • İstemci-sunucu: RESTful API desteği sunar.
  • Yapılandırılabilir: Sezgisel yapılandırma dosyaları kullanarak uygulamalar provision edilebilir.
  • Genişletilebilir: Builder + Factory pattern sayesinde uygulamalar kolayca genişletilebilir.
  • Dashboard: Kullanıcı dostu etkileşim için açık kaynaklı React+Next.js uygulaması olan R2R Dashboard'u sunar.

R2R Dashboard

Açık kaynaklı React+Next.js dashboard kullanarak R2R ile etkileşim kurulabilir. Başlamak için dashboard Cookbook'a bakılabilir.

1 yorum

 
GN⁺ 2024-06-28
Hacker News görüşleri
  • Veri çıkarımında doğruluk ve verimlilik: RAG sistemlerinde veri çıkarım süreci önemli bir zorluk. Geleneksel OCR yaklaşımı yetersiz kaldığı için doğruluk ve tutarlılığı artırmak adına multimodal LLM + OCR yaklaşımı kullanılıyor.

  • Benzer bir stack işletme deneyimi: 2 yıldır benzer bir stack işletiliyor; Pgvector, HyDe, web araması + belge araması gibi teknolojiler kullanılıyor. Loglar ve analizleri de içeren iyi bir dashboard mevcut.

  • Hızlı başlangıcın zorlukları: Hızlı başlangıç aslında o kadar da hızlı değil. Docker Compose ve Postgres image'ını içeren bir kurulum sunulmalı. Dashboard'u kullanmak için ayrı bir repo clone'lamak gerekmesi de zahmet yaratıyor.

  • Projenin karmaşıklığı: Proje çok sayıda bileşen içeriyor ama geliştirmeyi daha kolay hale getirmiyor. Bunun bir SDK mı yoksa uygulama koleksiyonu mu olduğu belirsiz. Tüm özelliklerin önizlenebilmesi için "1 tık" kurulum deneyimi sunulmalı.

  • Doğruluk doğrulaması: Yanıtların doğruluğunun nasıl doğrulanabileceğine dair soru var. Yanıtın nasıl üretildiğini izleyebilecek bir yöntem olup olmadığı merak ediliyor.

  • Veri toplamanın zorlukları: Birçok RAG projesinde veri toplama konusu düzgün çözülmüyor. Büyük miktarda HTML belgesinin sisteme toplu olarak nasıl aktarılabileceği soruluyor.

  • Multimodal veri toplama: Multimodal veri toplama sürecine dair daha ayrıntılı açıklama isteniyor. R2R'nin şu anda işleyebildiği veri türleri ve metin dışı veri türlerinin nasıl embedding'e dönüştürüldüğü soruluyor.

  • Geliştirme ekibi optimizasyonu: Sürecin geliştirme ekibi için nasıl daha hızlı ve daha optimize hale geldiğine dair açıklama isteniyor. MVP (minimum uygulanabilir ürün) geliştirme süresini hızlandırma potansiyeli yüksek.

  • Kaynak kodla çalışma: Kaynak kodu anlayabilen bir RAG çözümü aranıyor. Örneğin, "gönder" düğmesine tıklandığında çağrılan analiz event'ini anlayabilen bir özellik isteniyor.

  • Neo4j kullanımına karşı çıkış: Neo4j kullanılmak istenmiyor çünkü kaynak tüketimi yüksek.

  • Popüler sohbet frontend'leriyle entegrasyon: OpenWebUI gibi popüler sohbet frontend'leriyle entegrasyon olup olmadığı soruluyor.