Şu anda GeekNews, gömülü Google aramasını kullanıyor,
ve ben şahsen bunu biraz rahatsız edici buluyorum.
Yakın zamanda gördüğüm bir haberin kabaca anahtar kelimelerini hatırlayıp arattığımda,
bunu en yeniden eskiye sıralamanın bir yolu olmadığı için bulmak zor olabiliyor.
WASM ile bir vektör veritabanı gömülerek uygulanmış örnekler de gördüm,
ama arama motorları benim uzmanlık alanım olmadığı için bunu tasarlamak zor geliyor.
Ön uç tarafında fuzzy search gibi şeyler uygularsak, ister istemez sunucu yükü artacak gibi görünüyor,
Biraz dedikodu amaçlı bir soru ama, bunu etkili şekilde uygulamanın bir yolu var mı?
7 yorum
Ben aramayı seven tam bir arama meraklısıyım; günlük arama hacmi yaklaşık ne kadar oluyor?
Eğer azsa, mevcut arama yöntemini kabaca korurken rerank modeli kullanarak doğal dil aramasını denemek mümkün olabilir.
Bu, daha önce benim yaptığım hizmetin kabaca arama yapısıdır.
Kabaca, ilk aşamada
esile sorgu gönderip ardından cohere rerank API uyguluyorum; sonra da doğal dil ölçütüne göre rerank score'u en iyi uyan gövdeyi temel alarak servis ediyorum.Ama düşününce, Google'ı embedding ettiğinizi söylemeniz, arama sonucu öğelerinin içindeki HTML gövdesini almanın pek mümkün olmayacağı anlamına geliyor gibi. Yine de şimdilik bağlantıyı bırakıyorum.
Bağlantı: https://dev-wiki.dev/reading/tech/1
Ben çok boş vaktim olduğu ve aramayı sevdiğim için, bununla ilgili hâlâ konuşacak bir şey varsa bırakmanızı memnuniyetle karşılarım : )
Benim durumumda, en yeni sonuçların önce gelmemesi biraz rahatsız edici geliyor. Eski BBS panolarındaki gibi basitçe
LIKEsorgusuyla arama yapmak benim ihtiyaçlarıma daha çok uyacak gibi görünüyor. Gerçi hız nedeniylerangekonusunu biraz düşünmek gerekebilir..Benim de katıldığım bir rahatsızlık. Örneğin "AI" diye arama yaptığınızda 5 yıl önceki bir yazının ilk sayfada çıkması epey sık oluyor.
Gömülü Google arama sonuçları JSON olarak döndürülüyor gibi görünüyor, onları alıp sıralayabilirsiniz.
https://cse.google.com/cse/element/v1 isteğini kontrol edin
Google'da doğrudan arama yapmak nasıl olur?
query: site:news.hada.io duckdb
https://google.com/search/…