5 puan yazan GN⁺ 2024-10-22 | 1 yorum | WhatsApp'ta paylaş
  • Web sitelerini ePub'a dönüştüren bir araç
  • Web sitesinden HTML sayfalarının listesini çıkarıp bunları bir ePub kitabı olarak derleyerek istediğiniz eReader'a aktarabilirsiniz
  • JavaScript yazabilen ileri düzey kullanıcılar, sitenin ayrıştırmasını özelleştirmek için ek ayrıştırıcı tanımları ekleyebilir

Desteklenen siteler

  • Novel Update
  • Wuxia World
  • awesome-read-the-docs içindeki sitelerin çoğu
  • İçindekiler tablosu olarak UL/OL öğelerini kullanan, bağlantı metninde düzenli ifadeler kullanan veya sorgu seçicileri kullanan özel siteler
  • Önceden tanımlanmış başlık (header) öğeleri ve sonraki düğmesi (tıklanabilir) kullanan özel web uygulamaları

GN⁺ özeti

  • Epublifier, web sitesi içeriğini ePub biçimine dönüştürerek eReader'da kolayca okunmasını sağlayan bir araçtır
  • Bu araç özellikle Novel Update ve Wuxia World gibi siteleri destekler; ileri düzey kullanıcılar JavaScript aracılığıyla ayrıştırmayı özelleştirebilir
  • Bu araç, web içeriğini çevrimdışı okumak isteyen kullanıcılar için kullanışlıdır; benzer işlevler sunan araçlar arasında Calibre de bulunur

1 yorum

 
GN⁺ 2024-10-22
Hacker News yorumu
  • Calibre birçok siteyi destekliyor
  • Bu eklenti, kendisini diğer scraper'lardan ayıran noktayı açıklamayı amaçlıyor
    • Geleneksel scraper'ların iyi çalışmadığı web sitelerinde EPub üretmek için tasarlanmış
    • Genel amaçlı komut satırı scraper'ları ve diğer eklentiler yalnızca önceden tanımlanmış sitelerde çalışıyor
    • Karmaşık ayarlar veya kod gerektirebilir
    • Bazı siteler metni dinamik olarak üretmek veya getirmek için JavaScript kullanıyor
    • Tarayıcıda çalıştığı için tespit edilme ve engellenme olasılığı daha düşük
    • Tekrarlı kullanım veya arka plan görevleri için tasarlanmamış
    • Siteye özel ayar olmadan kolay scraping yapılabilmesi için bir UI sunuyor
    • Diğer programların/eklentilerin zaten işlediği sitelerde daha iyi performans beklenmemeli
    • Belirli bir siteye bağlı olmadığı için yazılmış
  • Bu programın ilginç yanı, rastgele sitelerden içerik çıkarmaya yönelik UI'si
  • Tüm bölümleri accordion arkasına gizlenmiş siteleri işleyebilirse harika olur
  • Ben de benzer bir şey yapıyorum
    • Bloglar ve web romanları gibi içerikler için bir web scraper ve ePub ayrıştırıcısı geliştiriyorum
    • Çevrimdışı okuma için bir PWA yardımcı uygulaması da geliştiriyorum
  • Bazen Paul Graham'ın denemelerini ePub olarak almak istiyorum
  • Basit bir sürümünü yapıp ePub dosyalarını sunucunun dosya sistemine kaydetmiştim
    • Web sitesinin sadeleştirilmiş belge görünümünü sunmak için Postlight Parser kullandım
  • Bu araç inanılmaz
    • Çevrimdışı seyahat için çok sayıda web sayfasını önbelleğe aldığım günler geride kaldı
  • fanfiction.net'i destekleyip desteklemediğini merak ediyorum
  • AWS, VueJS, MDN, w3schools, realpython, betterstack gibi bol dokümantasyonlu web sitelerinde çalıştırmayı isterdim