- Web sayfasındaki gereksiz yorumları, kenar çubuklarını, üst bilgileri ve alt bilgileri kaldırıp yalnızca ana içeriği ayıklayarak HTML/Markdown olarak çıkaran bir içerik ayrıştırıcısı
- YouTube videolarında konuşmaları konuşmacılara göre ayırarak çıkarır (
0.12.0 sürümünden itibaren)
- Obsidian Web Clipper için geliştirilmiş olsa da tarayıcı, Node.js gibi çeşitli ortamlarda kullanılabilir
- Mozilla Readability yerine geçecek şekilde tasarlanmıştır; daha esnek işleme ve daha tutarlı çıktı sunar
- Belirsiz ögelerin kaldırılmasını en aza indirir
- Dipnotlar, formüller, kod blokları gibi öğeler için standartlaştırılmış çıktı desteği
- Mobil stil analizi ile gereksiz ögeleri tespit eder
- schema.org meta verileri dahil daha fazla meta veriyi otomatik olarak çıkarır
- CLI arayüzü desteği sayesinde terminalden doğrudan HTML ve URL ayrıştırması yapılabilir
- MIT lisansı
8 yorum
Defuddle - Readability yerine geçebilecek açık kaynaklı bir HTML-to-Markdown aracı
Bu daha 10 ay önce de bir kez paylaşılmıştı; bu kez YouTube videolarındaki konuşmaları konuşmacı bazında ayırarak çıkarma özelliği eklenmiş.
Ayrıca bu süre içinde X URL’lerinden asenkron çıkarma, makale çıkarma, Substack uygulaması desteği, CLI eklenmesi ve GitHub URL desteği gibi pek çok özellik de eklenmiş.
Jina AI Reader - URL'leri LLM dostu girdilere dönüştüren araç
GeekNews iç bağlantılarına başlığı otomatik eklese güzel olurdu...
Düzelttim. Bundan sonra eklenen yorumların başlıkları otomatik olarak dönüştürülecek.
Vay canına, teşekkürler
Vay, demek ki bu gerçekten böyle anında oluyormuş ha vay be. Ben de rahatsız olduğum bir an yaşamıştım, keşke bunu söylemiş olsaymışım.
Markdown biraz belirsiz şekilde çıkarılıyor. Sanki yalnızca web sayfasında SEO’nun tam düzgün uygulandığı ölçütlerde iyi çıkarıyormuş gibi görünüyor. Doğru mu?
Claude Code ile birlikte kullanınca gerçekten çok iyi oluyor.