ArchiveTeam, tüm goo.gl kısaltılmış bağlantılarını arşivleme işini tamamladı
(tracker.archiveteam.org)- ArchiveTeam, tüm goo.gl kısaltılmış bağlantılarını başarıyla arşivledi
- ArchiveTeam Warrior adlı sanal arşivleme programı sayesinde herkes arşiv projesine katılabilir
- Bu Warrior, Windows, OS X, Linux ortamlarında ek bir risk olmadan çalıştırılabilir
- Kullanıcılar basit ayarlarla proje seçip etkinliklere katılabilir
- Özel teknik bilgi gerektirmeden arşiv çalışmalarına yardımcı olmayı sağlayan kolay ve sezgisel bir yöntem sunar
ArchiveTeam Warrior'a giriş
- ArchiveTeam Warrior, herkesin kolayca kullanabileceği bir sanal arşivleme appliance'ıdır
- Kullanıcılar Warrior'u çalıştırarak web siteleri ve benzerlerini indirebilir ve bunları ArchiveTeam arşivine yükleme sürecine katkı sağlayabilir
- Warrior, gerçek bilgisayar ortamına risk vermez ve yalnızca internet bant genişliği ile az miktarda disk alanı kullanır
- Windows, OS X ve Linux'u destekler; VirtualBox, VMware gibi sanal makine programları gerekir
VirtualBox ile kullanım
- Warrior appliance'ını (357MB) indirin
- VirtualBox'ta File > Import Appliance menüsüne tıklayıp indirilen dosyayı içe aktarın
- Sanal makineyi başlattığınızda en güncel güncellemeleri otomatik alır ve web tarayıcısını kullanma isteğinde bulunur
Warrior çalıştırıldıktan sonraki süreç
- adresine girip Settings sayfasını kontrol edin
- Leaderboard'da ilerlemenin görünmesi için bir kullanıcı adı seçin
- All projects sekmesinden istediğiniz projeyi seçerek katılın; en acil projeye katılmak için ArchiveTeam’s Choice seçeneğini de kullanabilirsiniz
Katılımın faydaları
- Özel teknik bilgi veya karmaşık süreçler olmadan herkes arşiv projelerine kolayca katkıda bulunabilir
- Kullanıcının arşiv katkı geçmişi leaderboard'da görünür; bu da motivasyon ve iş birliği etkisi sağlar
1 yorum
Hacker News yorumları
ArchiveTeam böyle projeler yaptığında her seferinde gerçekten hayran kalıyorum. Birkaç yıl önce çalıştığım video platformu yakında hizmeti sonlandıracağını açıkladığında ArchiveTeam'den biriyle bağlantı kurmuştum; verileri koruma çalışmasıyla ilgilendiklerini duydum. Ona biraz tavsiye verdim (arşivleme sırasında sorun çıkarabilecek sunucu endpoint'leri hakkında) ve birkaç EC2 instance'ımı geçici olarak ödünç verdim. Sunucular bana ait olduğu için neler olduğunu görebiliyordum; 2 dakika içinde instance'lar tamamen hazır hale geldi ve hızla videoları arşivlemeye başladılar, her instance da çakışma olmadan farklı videoları verimli biçimde indiriyordu. ArchiveTeam'in misyonu zaten çok iyi ama işi yürütme verimlilikleri gerçekten etkileyici.
Başlık doğru değil. Aslında Archiveteam.org, Archive.org değil. The Internet Archive depolama alanı sağlıyor ama asıl arşivleme işini Archiveteam üyeleri yapıyor.
Bununla ilgili bir şey paylaşmak istiyorum: "Link çürümesine karşı savaşa katılın" (bağlantı), Google'ın goo.gl politika değişikliği hakkında çeşitli HN tartışma başlıkları (2018~2025 ilgili yazılar derlemesi, burada, burada, burada, burada, burada, burada). Çeşitli tartışmalar var, umarım faydalı olur.
Google'ın son güncellemesini paylaşıyorum: Google blog güncellemesi bağlantısı
reddit ya da twitter'ın tamamını arşivleyen biri var mı? Her ne kadar şartları artık buna izin vermeyecek şekilde değişmiş olsa da merak ediyorum.
Sayfayı pek anlayamadım. Bir veri kümesi listesi (muhtemelen?) yayınlanmış ve boyut 91 TiB'e kadar çıkıyor gibi görünüyor. Sadece Google kısa bağlantıları ve hedef URL listesi için 91 TiB gerekmesi pek olası gelmiyor. Nasıl çalıştığını bilen var mı?
Bu arşivleme işine az da olsa katkıda bulunabildiğim için mutluyum.
Ne kadar çok bağlantının özel YouTube videolarına ya da Google dokümanlarına gittiğini merak ediyorum.
"all" ifadesinin gerçekten herkese açık tüm URL'leri mi kastettiğini, yoksa URL ad alanının tamamının tekrarlı biçimde denenmiş olduğunu mu merak ediyorum.