18 puan yazan GN⁺ 2024-10-17 | 2 yorum | WhatsApp'ta paylaş
  • ArchiveBox, internet arşivini kendi kendine barındırmak için yeni özellikler tanıttı
  • Archive.org’a yönelik son saldırıların ardından ArchiveBox’a ilgi artıyor
    • ArchiveBox, Archive.org’un misyonunu desteklediğini ve hizmetlerinin insanlık için önemli bir değer sunduğunu vurguluyor

Kamusal arşivlerin sınırları

  • İnsanlar, kalıcı olarak arşivleme konusundaki korkular nedeniyle arşivlemeye mesafeli durabiliyor
  • Bireylerin, kendileri için önemli gördükleri şeyleri arşivleme yetkisine sahip olması gerekiyor
  • Modern web ortamına uygun olarak kişisel ve yarı özel içerikleri arşivleyebilecek çözümlere ihtiyaç var

Arşivlemenin önemi

  • Aileler, bireyler ve şirketler kendileri için önemli içerikleri korumak istiyor
  • Kişisel içerik arşivlemesi güvenlik açısından zorluklar barındırıyor ve dikkat gerektiriyor

Kötü niyetli içerik

  • Kamusal arşivler bazen ırkçılık, şiddet ve nefret söylemi gibi içerikleri koruyarak sorun yaratabiliyor
  • Bu tür içeriklerin nasıl korunacağı konusunda düşünmek gerekiyor

ArchiveBox’un yeni eklenti ekosistemine giriş

  • ArchiveBox v0.8, projenin tarihindeki en büyük güncelleme olarak yeni bir eklenti ekosistemi sunuyor
  • Topluluk destekli çeşitli işlevler sunan eklentiler buna dahil
    • yt-dlp, YouTube, Soundcloud, YouKu vb. platformlardan video, ses ve altyazı indiriyor
    • papers-dl, DOI numarası görüldüğünde bilimsel makalelerin PDF’lerini otomatik indiriyor
    • gallery-dl, Flickr, Instagram vb. platformlardan fotoğraf galerileri indiriyor
    • forum-dl, eski forumları ve derin iç içe geçmiş yorum dizilerini indiriyor
    • readability, makale metnini .txt, .md, .epub olarak çıkarıyor
    • ai, sayfa ekran görüntülerini ve metni özelleştirilmiş istemlerle birlikte LLM’e gönderip yanıtları kaydediyor
    • webhooks, bazı sonuçlar her kaydedildiğinde harici API’leri tetikliyor ve Slack, N8N vb. servislere ping gönderiyor
    • Bunun dışında da birçok özellik bulunuyor
  • Eklenti sistemi, pluggy ve pydantic kütüphaneleri temel alınarak oluşturuldu

Ek geliştirmeler

  • Yeni REST API, django-ninja ile inşa edildi
  • Harici depolama desteği eklendi
  • İçerik adreslenebilir depolama sistemi için ilk aşama devreye alındı
  • Arka plan iş sistemi eklendi
  • Basit kullanım isteyenler için yeni araç abx-dl yakında çıkacak

"ArchiveBox, SQLite kullanan local-first bir yapıyla tasarlandı ve P2P her zaman isteğe bağlıdır"

GN⁺ özeti

  • ArchiveBox, bireylerin ve şirketlerin kendi internet arşivlerini kurmasına yardımcı olan bir araç ve son değişiklikler bunu daha da güçlendiriyor
  • Kamusal arşivlerin sınırlarını tamamlıyor ve kişisel ya da hassas içeriklerin güvenle korunabilmesi için yöntemler sunuyor
  • Eklenti ekosistemi, çeşitli işlevler sağlayarak kullanıcı deneyimini iyileştiriyor

2 yorum

 
GN⁺ 2024-10-17
Hacker News görüşleri
  • ArchiveBox’un sürdürülebilirliği ve iyileştirme ihtiyacı hakkında görüşler var. Topluluğun katılımı önemli ve tek bir geliştiricinin yaşadığı zorluklar anlaşılabiliyor.

    • ArchiveBox’un daha istikrarlı ve güvenilir bir proje haline gelmesi için topluluk desteğine ihtiyaç var.
    • Arşivleme yalnızca geçmiş için değil, gelecek için de yapılıyor; sürdürülebilir bir geliştirme organizasyonuna ihtiyaç olabilir.
  • ArchiveBox’un yeni API’si ve eklentileri için beklenti var. 2 yıldır arşivleme amacıyla kullanıldığı belirtiliyor.

  • grab-site gibi araçlar WARC arşivleri oluşturmak ve saklamak için faydalı olabilir. Dağıtık arşivleme için CDX indeksleri ve şifreli imza desteği gerekebilir.

  • ArchiveBox kullanarak eski tekneler hakkındaki bilgileri arşivleme deneyimi paylaşılmış. Eski web forumlarının ortadan kaybolmuş olmasına duyulan üzüntü dile getiriliyor.

  • Kişisel web sayfalarını arşivlemek için Readeck.org kullanılıyor ve ArchiveBox’un dağıtık arşivleme yönüne ilgi duyuluyor.

  • abx-dl kullanılabilirliği hakkında soru soruluyor ve paketleme desteği sağlama isteği belirtiliyor.

  • REST API için beklenti var ve arama işlevinin olmamasından dolayı hayal kırıklığı ifade ediliyor. FTS indeksi üzerinden sorgulama işlevine ihtiyaç var.

  • ArchiveBox kullanarak web sitesi arşivlemeyi deneme gerekliliği hissediliyor. Pinboard aboneliğinin arşiv dışa aktarma özelliği çalışmıyor.

  • Arşivlenen veriler için Merkle ağacı oluşturma önerisi yapılıyor. Verinin özgünlüğünü kanıtlamak için blockchain düşünülebilir.

  • Kendi kendine barındırılan web sitesi değişiklik izleme sistemi için öneri isteniyor. Huginn kullanılıyor ancak modern JS tabanlı sitelerde zorluk yaşanıyor.