ArchiveBox gelişiyor: Kendi kendine barındırılan internet arşivinin geleceği
(docs.sweeting.me)- ArchiveBox, internet arşivini kendi kendine barındırmak için yeni özellikler tanıttı
- Archive.org’a yönelik son saldırıların ardından ArchiveBox’a ilgi artıyor
- ArchiveBox, Archive.org’un misyonunu desteklediğini ve hizmetlerinin insanlık için önemli bir değer sunduğunu vurguluyor
Kamusal arşivlerin sınırları
- İnsanlar, kalıcı olarak arşivleme konusundaki korkular nedeniyle arşivlemeye mesafeli durabiliyor
- Bireylerin, kendileri için önemli gördükleri şeyleri arşivleme yetkisine sahip olması gerekiyor
- Modern web ortamına uygun olarak kişisel ve yarı özel içerikleri arşivleyebilecek çözümlere ihtiyaç var
Arşivlemenin önemi
- Aileler, bireyler ve şirketler kendileri için önemli içerikleri korumak istiyor
- Kişisel içerik arşivlemesi güvenlik açısından zorluklar barındırıyor ve dikkat gerektiriyor
Kötü niyetli içerik
- Kamusal arşivler bazen ırkçılık, şiddet ve nefret söylemi gibi içerikleri koruyarak sorun yaratabiliyor
- Bu tür içeriklerin nasıl korunacağı konusunda düşünmek gerekiyor
ArchiveBox’un yeni eklenti ekosistemine giriş
- ArchiveBox v0.8, projenin tarihindeki en büyük güncelleme olarak yeni bir eklenti ekosistemi sunuyor
- Topluluk destekli çeşitli işlevler sunan eklentiler buna dahil
yt-dlp, YouTube, Soundcloud, YouKu vb. platformlardan video, ses ve altyazı indiriyorpapers-dl, DOI numarası görüldüğünde bilimsel makalelerin PDF’lerini otomatik indiriyorgallery-dl, Flickr, Instagram vb. platformlardan fotoğraf galerileri indiriyorforum-dl, eski forumları ve derin iç içe geçmiş yorum dizilerini indiriyorreadability, makale metnini .txt, .md, .epub olarak çıkarıyorai, sayfa ekran görüntülerini ve metni özelleştirilmiş istemlerle birlikte LLM’e gönderip yanıtları kaydediyorwebhooks, bazı sonuçlar her kaydedildiğinde harici API’leri tetikliyor ve Slack, N8N vb. servislere ping gönderiyor- Bunun dışında da birçok özellik bulunuyor
- Eklenti sistemi,
pluggyvepydantickütüphaneleri temel alınarak oluşturuldu
Ek geliştirmeler
- Yeni REST API,
django-ninjaile inşa edildi - Harici depolama desteği eklendi
- İçerik adreslenebilir depolama sistemi için ilk aşama devreye alındı
- Arka plan iş sistemi eklendi
- Basit kullanım isteyenler için yeni araç
abx-dlyakında çıkacak
"ArchiveBox, SQLite kullanan local-first bir yapıyla tasarlandı ve P2P her zaman isteğe bağlıdır"
GN⁺ özeti
- ArchiveBox, bireylerin ve şirketlerin kendi internet arşivlerini kurmasına yardımcı olan bir araç ve son değişiklikler bunu daha da güçlendiriyor
- Kamusal arşivlerin sınırlarını tamamlıyor ve kişisel ya da hassas içeriklerin güvenle korunabilmesi için yöntemler sunuyor
- Eklenti ekosistemi, çeşitli işlevler sağlayarak kullanıcı deneyimini iyileştiriyor
2 yorum
ArchiveBox - self-hosted web arşivleme aracı
Hacker News görüşleri
ArchiveBox’un sürdürülebilirliği ve iyileştirme ihtiyacı hakkında görüşler var. Topluluğun katılımı önemli ve tek bir geliştiricinin yaşadığı zorluklar anlaşılabiliyor.
ArchiveBox’un yeni API’si ve eklentileri için beklenti var. 2 yıldır arşivleme amacıyla kullanıldığı belirtiliyor.
grab-sitegibi araçlar WARC arşivleri oluşturmak ve saklamak için faydalı olabilir. Dağıtık arşivleme için CDX indeksleri ve şifreli imza desteği gerekebilir.ArchiveBox kullanarak eski tekneler hakkındaki bilgileri arşivleme deneyimi paylaşılmış. Eski web forumlarının ortadan kaybolmuş olmasına duyulan üzüntü dile getiriliyor.
Kişisel web sayfalarını arşivlemek için Readeck.org kullanılıyor ve ArchiveBox’un dağıtık arşivleme yönüne ilgi duyuluyor.
abx-dlkullanılabilirliği hakkında soru soruluyor ve paketleme desteği sağlama isteği belirtiliyor.REST API için beklenti var ve arama işlevinin olmamasından dolayı hayal kırıklığı ifade ediliyor. FTS indeksi üzerinden sorgulama işlevine ihtiyaç var.
ArchiveBox kullanarak web sitesi arşivlemeyi deneme gerekliliği hissediliyor. Pinboard aboneliğinin arşiv dışa aktarma özelliği çalışmıyor.
Arşivlenen veriler için Merkle ağacı oluşturma önerisi yapılıyor. Verinin özgünlüğünü kanıtlamak için blockchain düşünülebilir.
Kendi kendine barındırılan web sitesi değişiklik izleme sistemi için öneri isteniyor. Huginn kullanılıyor ancak modern JS tabanlı sitelerde zorluk yaşanıyor.