warc-parquet - WARC'ı Parquet'e dönüştüren CLI (github.com/maxcountryman) 8 puan yazan xguru 2022-06-30 | 1 yorum | WhatsApp'ta paylaş Web ARChive (.warc) dosyalarını sütun tabanlı Apache Parquet formatına dönüştürür Parquet'i DuckDB'ye yükleyip kolayca sorgulama yapılabilir Rust açık kaynak projesi İlgili okumalar WarcDB - Web tarama verilerini SQLite DB olarak kullanma 14 puan · 0 yorum · 2022-06-22 Carquet - Parquet dosyalarını okumak ve yazmak için yüksek performanslı saf C kütüphanesi 9 puan · 0 yorum · 2026-01-17 dir2md v1.0.4 — Açık kaynak kod tabanlarını LLM-Friendly Markdown’a dönüştüren CLI için büyük güncelleme 8 puan · 0 yorum · 2025-10-10 Broot - Karmaşık dizin ağaçlarında gezinmek için yeni bir CLI aracı 7 puan · 3 yorum · 2020-01-10 DuckLake - Birleşik veri gölü ve katalog formatı 13 puan · 1 yorum · 2025-05-29 1 yorum xguru 2022-06-30 DuckDB - Gömülü OLAP DB açık kaynak Kısa süre önce paylaşılan WarcDB - Web crawl data as SQLite DB ile benzer görünüyor. Ancak Parquet kullanan altyapının zaten bulunduğu yerlerde kullanımı daha kolay olabilir
1 yorum
DuckDB - Gömülü OLAP DB açık kaynak
Kısa süre önce paylaşılan WarcDB - Web crawl data as SQLite DB ile benzer görünüyor.
Ancak Parquet kullanan altyapının zaten bulunduğu yerlerde kullanımı daha kolay olabilir