FLAMEHAVEN FileSearch v1.3.1 – ML bağımlılıkları kaldırıldı ve semantik arama motoru baştan aşağı yenilendi
(github.com/flamehaven01)FLAMEHAVEN FileSearch,
👉 “Belge araması için RAG’i hafif, yeniden üretilebilir ve tamamen self-hosted hale getirmek mümkün mü?” sorusuyla başlayan açık kaynaklı bir projedir.
Şu anda ⭐ 81 Star / 🍴 11 Fork ile küçük ölçekli olsa da, her sürümde net iyileştirmeleri sürdürmüş bir projedir.
Bu v1.3.1 sürümü basit bir özellik eklemesi değil;
👉 “semantik arama = ağır ML yığını” varsayımını yıkan bir güncellemedir.
🔍 Projenin tek cümlelik özeti
-
Self-hosted RAG arama motoru
-
Belgeleri (PDF/DOCX/MD/TXT) yüklediğinizde anahtar kelime + semantik + hibrit arama
-
Harici bir vektör DB olmadan yerelde çalışır
-
Docker ile tek satırda 3 dakika içinde çalıştırılabilir
✨ v1.3.1 temel güncellemeleri (geliştiricilerin seveceği noktalar)
1️⃣ ML bağımlılıkları tamamen kaldırıldı (en büyük değişiklik)
-
sentence-transformers/torchtamamen kaldırıldı -
Kurum içi geliştirilen DSP v2.0 (Deterministic Semantic Projection) eklendi
-
✔️ Vektör oluşturma < 1ms
-
✔️ Başlatma gecikmesi yok (önceden 2 dakika → anında)
-
Semantik arama yapıyor ama ML framework’leri olmadan deterministik olarak çalışıyor
2️⃣ Bellek ve performans optimizasyonu
-
int8vektör nicemlemesi
→ bellek kullanımı %75 azaldı -
Kosinüs benzerliği hesaplamasında %30’dan fazla hız artışı
-
Metadata %90’dan fazla sıkıştırıldı (Gravitas-Pack)
-
Kişisel sunucularda / şirket içi VM’lerde rahatça işletilebilir
3️⃣ Arama modları genişletildi
-
keyword/semantic/hybridarama modları destekleniyor -
typo correction + query refinement içeriyor
-
Mevcut API ile tamamen backward-compatible
4️⃣ Kararlılık ve güvenilirlik
-
Test framework’ü
pytest→unittestolarak değiştirildi -
19/19 test geçti (0.33s)
-
Timeout ve CI kararsızlıkları giderildi
🔐 Korunan production özellikleri
-
API Key tabanlı kimlik doğrulama ve yetki yönetimi
-
Rate limiting / Audit log
-
Batch search (1~100 sorgu)
-
İsteğe bağlı Redis cache
-
Prometheus metrikleri
👀 Özellikle şu kişiler için uygun
-
Şirket içi belge araması için yerel bir RAG’e ihtiyaç duyan ekipler
-
Veriyi harici SaaS’lere (Pinecone vb.) yüklemenin zor olduğu ortamlar
-
“PoC tamam ama operasyonu nasıl yöneteceğiz?” aşamasındaki geliştiriciler
-
Yeniden üretilebilirlik / maliyet / kontrolü önemseyen mühendisler
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---Kullanıp faydalı bulduysanız ⭐ bırakmanız büyük destek olur.
Görüş, geri bildirim ve PR’ların hepsi memnuniyetle karşılanır.
Henüz yorum yok.