-
İnternetin büyüklüğü ve içeriğin kaybolması
- On milyarlarca web sayfasının bulunduğu internet, modern yaşamın devasa bir deposu.
- Ancak kullanıcıların güvendiği içerikler zaman zaman ortadan kayboluyor.
- Pew Research Center'ın yeni analizi, çevrimiçi içeriğin son derece geçici olduğunu gösteriyor.
- 2013 ile 2023 arasında var olan tüm web sayfalarının dörtte biri, Ekim 2023 itibarıyla artık erişilemez durumda.
- Bunun başlıca nedeni, belirli web sayfalarının silinmiş veya kaldırılmış olması.
-
Dijital çürümenin ortaya çıkışı
- Hükümet ve haber siteleri ile Wikipedia sayfalarının "kaynakça" bölümleri incelendi.
- Haber sayfalarının %23'ü en az bir bozuk bağlantı içeriyor.
- Hükümet sitelerinin %21'i en az bir bozuk bağlantı içeriyor.
- Wikipedia sayfalarının %54'ü artık var olmayan sayfalara giden bağlantılar içeriyor.
- Hükümet ve haber siteleri ile Wikipedia sayfalarının "kaynakça" bölümleri incelendi.
-
Sosyal medyada dijital çürüme
- 2023 ilkbaharında sosyal medya platformu X'ten (o zamanki adıyla Twitter) gerçek zamanlı bir tweet örneklemi toplandı ve 3 ay boyunca takip edildi.
- Tweet'lerin yaklaşık beşte biri, paylaşımdan birkaç ay sonra artık herkese açık şekilde görünmüyor.
- Bu vakaların %60'ında, orijinal tweet'i paylaşan hesabın gizliye alınmış, askıya alınmış ya da tamamen silinmiş olduğu görüldü.
- Kalan %40'ta ise hesap varlığını sürdürse de ilgili tweet silinmişti.
- 2023 ilkbaharında sosyal medya platformu X'ten (o zamanki adıyla Twitter) gerçek zamanlı bir tweet örneklemi toplandı ve 3 ay boyunca takip edildi.
-
Erişilemeyen bağlantılar ve web sayfası tanımı
- İnternette bir zamanlar var olup şimdi erişilemeyen sayfaların tanımı birkaç farklı şekilde yapılabiliyor.
- Sayfa artık barındırıldığı sunucuda bulunmuyor ya da sunucunun kendisi artık mevcut değil.
- Sayfanın adresi duruyor ama içeriği değişmiş durumda.
- Sayfa mevcut olsa da belirli kullanıcıların (ör. görme engelliler) okuması zor.
- Bu rapor, ilk tanıma odaklanıyor: artık var olmayan sayfalar.
- İnternette bir zamanlar var olup şimdi erişilemeyen sayfaların tanımı birkaç farklı şekilde yapılabiliyor.
-
Son 10 yıldaki web sayfaları
- Common Crawl arşivinden rastgele yaklaşık 1 milyon web sayfası örneklemi toplandı.
- 2013'ten 2023'e kadar toplanan tüm sayfaların %25'i, Ekim 2023 itibarıyla artık erişilemez durumda.
- 2013'te toplanan sayfaların %38'ine 2023'te artık erişilemiyor.
- Common Crawl arşivinden rastgele yaklaşık 1 milyon web sayfası örneklemi toplandı.
-
Hükümet sitelerindeki bağlantılar
- 2023 Mart/Nisan döneminde toplanan hükümet sitelerinden yaklaşık 500 bin sayfa örneklenmiş.
- Sayfaların %86'sı dahili bağlantılar içeriyor ve bunların %6'sına artık erişilemiyor.
- Genel olarak incelenen hükümet web sayfalarının %21'i en az bir bozuk bağlantı içeriyor.
- 2023 Mart/Nisan döneminde toplanan hükümet sitelerinden yaklaşık 500 bin sayfa örneklenmiş.
-
Haber sitelerindeki bağlantılar
- 2023 Mart/Nisan döneminde toplanan haber sitelerinden yaklaşık 500 bin sayfa örneklenmiş.
- Haber sitelerinin %94'ü en az bir harici bağlantı içeriyor ve sayfaların %23'ü en az bir bozuk bağlantı barındırıyor.
- 2023 Mart/Nisan döneminde toplanan haber sitelerinden yaklaşık 500 bin sayfa örneklenmiş.
-
Wikipedia'daki kaynak bağlantıları
- 50.000 İngilizce Wikipedia sayfası rastgele örneklenmiş.
- Toplanan sayfaların %82'si en az bir kaynak bağlantısı içeriyor ve bu kaynak bağlantılarının %11'ine artık erişilemiyor.
- 50.000 İngilizce Wikipedia sayfası rastgele örneklenmiş.
-
Twitter gönderileri
- 2023 ilkbaharında 5 milyon tweet toplandı ve 3 ay boyunca takip edildi.
- Toplanan tweet'lerin %18'i, takip döneminin sonunda artık herkese açık şekilde görünmüyordu.
- Silinen tweet'lerin %60'ında hesap gizliye alınmış, askıya alınmış ya da silinmişti.
- Tweet'lerin %1'i bir saat içinde, %3'ü bir gün içinde, %10'u bir hafta içinde ve %15'i bir ay içinde siliniyor.
- 2023 ilkbaharında 5 milyon tweet toplandı ve 3 ay boyunca takip edildi.
-
Tweet'lerin hayatta kalma analizi
- Kaybolan tweet'lerin yarısı, paylaşımın ardından ilk 6 gün içinde ortadan kalkıyor.
- Tweet'lerin %90'ı, paylaşımın ardından 46 gün içinde erişilemez hale geliyor.
- Silinip daha sonra yeniden herkese açık hale gelen tweet'lerin oranı %6.
1 yorum
Hacker News görüşü
Hacker News yorumları derleme özeti
Facebook sayfalarının sorunu
Arşivleme çabaları
Internet Archive desteği
Haber sitesi işletme deneyimi
Web sitesi ömrü grafiği
Eski web sitelerinin sorunları
İnternetin geçiciliği
SEO sorunu
Bağlantı kırılması sorunu
Unutmanın ve affetmenin önemi