12 puan yazan xguru 2021-07-21 | 1 yorum | WhatsApp'ta paylaş
  • Rust + Tantivy tabanlı (Rust ile yazılmış, Apache Lucene'e benzer açık kaynak; Korece tokenizer desteği sunar)

  • Büyük veri kümelerini indekslemek için iyi şekilde tasarlanmış

→ Compute ve Storage ayrıdır: S3 gibi depolar aranabilir

→ Kolay arama kümesi yönetimi: birkaç saniye içinde instance ekleme/çıkarma mümkün

  • Desteklenen özellikler

→ İndeks ve küme yönetimi için basit bir CLI

→ Yerel/uzak indeksler

→ Stateless instance'lar

→ Byte Range sorgularını destekleyen herhangi bir nesne depolama üzerinde kullanılabilir

→ Full Text arama (Phrase Query dahil)

→ Yerleşik zaman bölümleme desteği

→ Boolean sorgu desteği

→ Text, i64, f64, date, bytes, composite types object, array veri tiplerini destekler

1 yorum

 
xguru 2021-07-21

Bunun nasıl maliyet açısından verimli hale getirildiği, blogda yazılan tanıtım yazısında anlatılıyor.

Daha önce " Bayard - Rust ile geliştirilmiş tam metin arama ve indeksleme sunucusu https://tr.news.hada.io/topic?id=841 " tanıtılırken Tantivy'de Korece tokenizer yoktu, ama eklenmiş görünüyor.

https://github.com/lindera-morphology/lindera-ko-dic-builder

Korece tokenizer