Marginalia arama motorunun gelişimi
- Marginalia Search ilk başladığında küçük bir deneydi, ancak artık tam zamanlı yürütülen bir projeye dönüştü.
- Arama motoru şimdiye kadarki en iyi halinde çalışıyor ve birçok kilometre taşına ulaştı.
- Arama motoru artık oturma odasından çıkıp uygun bir kurumsal sunucuya taşındı.
Kod tabanının düzenlenmesi ve uygulamanın sadeleştirilmesi
- Bu yılın ana teması kod tabanını düzenlemek ve uygulamayı sadeleştirmek oldu.
- Odak noktası, operasyonel yükü yönetilebilir tutmak ve başkalarının uygulamaya ve kod tabanına daha kolay erişebilmesini sağlamak oldu.
- Çok iş gerekti, ancak bunun meyveleri görülmeye başlandı.
Operasyonel iyileştirmeler
- Geçmişte indeksi değiştirirken günler süren kesinti gerekiyordu, ancak artık bu sorun ortadan kalktı.
- Son dönemde artık sıfır kesintiyle yükseltme de mümkün hale geldi.
- Operasyon tarafında haftalar süren manuel süreçler artık GUI'de bir düğmeye basmaya indirgenmiş durumda.
Anchor text anahtar kelime desteğinin eklenmesi
- Anchor text anahtar kelime desteğinin eklenmesi, arama motorunun ilgili sonuçları bulma yeteneği üzerinde büyük etki yarattı.
- Değişiklik ilk yapıldığında entegrasyon iyi oturmadığı için hemen fark edilmedi, ancak yeni alaka sinyali yerleşince şaşırtıcı anlar yaşandı.
Tam zamanlı çalışmaya geçiş
- NLnet'in desteği sayesinde yaklaşık 8 ay önce projeye tam zamanlı geçildi.
- En zor kısım fazla çalışmamak oldu; haftada en az bir gün dinlenmeye çalışılıyor.
- Yeterince dinlenildiğinde daha akıllı çalışıldığı bilindiği için, teorik olarak işi daha iyi yapmak adına ara sıra dinlenmek önemli.
1 milyar belge indeksleme hedefi
- 1 milyar belgeyi indeksleme yolculuğu yavaş ama istikrarlı biçimde ilerliyor.
- Zorluk yazılımın işleyememesinden değil, webdeki sinyal-gürültü oranının düşük olmasından kaynaklandığı için beklenenden daha zor ilerliyor.
- Arama motorunun nispeten iyi çalışmasının en büyük nedenlerinden biri, indekslemediği içerikler.
- İndeks bir yıl önce 50 milyon ile 100 milyon arasındaydı; son crawl'da 220 milyona ulaştı ve bir sonraki crawl turu bittiğinde 290 milyon ile 300 milyon arasında olması bekleniyor.
Sorgu ayrıştırma ve yürütme iyileştirmeleri
- Sorgu ayrıştırma ve yürütme alanında geliştirilecek çok yer var.
- Asıl çalışma başlamadan önce, etkilenen kodu düzenlemek için hazırlık çalışmalarına başlandı.
- Projedeki büyük sıçramalar her zaman deneysel oldu; planlanan şeyler de var, ancak asıl büyük etkiyi planlanmamış olanların yaratacağı görülüyor.
Teşekkür
- NLnet'e, FUTO'ya, Patreon destekçilerine, savunuculara ve kullanıcılara teşekkür ediliyor.
- Onların desteği olmadan bunların hiçbiri mümkün olmazdı.
GN⁺ görüşü
- Marginalia Search, küçük bir deney olarak başlayıp sürekli iyileştirmeler ve topluluk desteğiyle tam zamanlı bir projeye dönüşen bir örnek.
- Anchor text anahtar kelime desteği gibi işlevsel iyileştirmeler, arama motorunun performansını ciddi biçimde artıran önemli değişiklikler olarak öne çıkıyor.
- Bu proje, açık kaynak topluluğu ve geliştiriciler için iş birliği ve katkı fırsatları sunarken arama motoru teknolojisinin gelişimine de katkı sağlıyor.
1 yorum
Hacker News görüşleri