- Yeni tarayıcı tabanlı Wikipedia arama motoru hakkında bir yazı; çevrimdışı arama mümkün
- Arama motoru, gerçek zamanlı olarak bir milyon Wikipedia sayfasında arama yapabiliyor; mobil cihazlarda her 10 ms'de bir sonuç döndürüyor
- Arama motoru veritabanının küçük boyutu; özel bir işlem gerektirmeden bir milyon embedding'i destekleyen gündelik kullanım senaryoları
- Arama motoru, belge embedding'leri için sentence transformer kullanıyor, embedding sıkıştırma için product quantization uyguluyor ve tarayıcıda mesafe hesaplamalarını çalıştırmak için
pq.js kullanıyor
- Arama motoru, sorgular için tarayıcı içinde sentence transformer çalıştırmak amacıyla
transformers.js kullanıyor
- Arama motoru, embedding'leri sıkıştırılmış sayfa boyutuna göre sıralıyor; bilgi yoğunluğu yüksek sayfalar önce analiz ediliyor ve ilk 10 sırada döndürülüyor
- Arama motoru, yüksek performans için JSON yerine Arrow kullanıyor; Arrow, 8 bit tamsayı product quantization dizilerini kompakt biçimde saklayabiliyor
- Arama motoru, WebAssembly üzerinde çalışan ONNX modelleri kullanıyor; henüz GPU hızlandırması yok
- Arama motoru, tüm Wikipedia'yı sentence transformer ile embedding'e dönüştürüyor, embedding'leri product quantization ile sıkıştırıyor ve ONNX'i elle yazıyor
- Arama motoru, embedding'leri ve meta veriyi saklamak için numpy'yi Arrow'a aktarıyor; bu yöntem bellek ve disk üzerinde çok daha kompakt
- Arama motoru, ürün alt kategorilerinde gerçek zamanlı aramaya izin veren faceted search desteği sunuyor
- Yazar, özellikle farklı quantization seviyeleri ve farklı embedding boyutları desteği konusunda geri bildirim ve iyileştirme önerileri bekliyor
1 yorum
Hacker News görüşleri