1 puan yazan mansuiki 4 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş

Merhaba. turbovec/TurboQuant tabanlı constrained RAG için bir graph memory layer eklenmiş turbo-graph geliştirdim.

turbovec, flat top-k ya da ucuz bir allowlist olduğunda zaten iyi çalışıyor. Ancak gerçek RAG senaryolarında sorgular sık sık şu biçimde oluyor:

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

Bu kombinasyonu her seferinde Python/SQL/app layer içinde oluşturup sonra yeniden vector search'e vermek, sonuçları graph/BM25 ile rerank etmek ve neden böyle sonuçlar çıktığını explain eden kodu yazmak tekrar tekrar karşımıza çıkıyordu.

turbo-graph, turbovec uyumlu çekirdeği korurken etrafındaki graph/metadata view compilation, cache reuse, graph rerank ve explain telemetry işlerini index layer'a taşımayı deneyen bir çalışma.

Henüz Alpha aşamasında olduğu için amaç bunu doğrudan production'da kullanın demekten çok, gerçek RAG route'larında hangi API'lere ihtiyaç olduğunu anlamak için geri bildirim toplamak.

GitHub:
https://github.com/bigmacfive/turbo-graph

Henüz yorum yok.

Henüz yorum yok.