4 Ekim'de Facebook'un Nasıl Ortadan Kaybolduğunu Anlamak
(blog.cloudflare.com)-
4 Ekim'de Facebook'la ilgili hizmetlere neden erişilemediğini Cloudflare'ın dışarıdan analiz ettiği yazı
-
DNS lookup en baştan başarısız oldu ve Facebook'la ilgili tüm altyapının IP bağlantısı kesildi
-
Facebook'un resmi açıklaması şöyleydi:
→ "Veri merkezleri arasındaki ağ trafiğini koordine eden omurga yönlendirici yapılandırmasında yapılan bir değişiklik sırasında sorun oluştu. Bu durum veri merkezleri arasındaki bağlantıyı zincirleme biçimde etkileyerek hizmetlerin kesilmesine yol açtı"
→ DNS sunucuları normalde kendilerini BGP üzerinden duyurur; ancak Facebook'un DNS sunucuları, Facebook veri merkezleriyle bağlantı kurulamazsa BGP'yi devre dışı bırakacak şekilde yapılandırılmıştı
→ Veri merkezi omurgası kopunca BGP istekleri reddedildi ve DNS sunucularına erişim imkansız hale geldi
→ Bu yüzden tüm Facebook sunucularına erişilememesi asıl sorun haline geldi
→ Gerçekten de veri merkezine fiziksel erişim bile zorlaştığı için mühendislerin sahaya gidip sorunu çözdüğü söyleniyor
-
Sorun, sanki birisi Facebook veri merkezinin internet kablosunu çekmiş gibi ortaya çıktı
-
Bu bir DNS sorunu değildi, ancak DNS hatası büyük ölçekli kesintinin ilk belirtisiydi
-
BGP (Border Gateway Protocol)
→ İnternetteki AS'lerin (Autonomous Systems) yönlendirme bilgisi alışverişi yapma mekanizmasıdır
→ Büyük yönlendiriciler, yönlendirme bilgisini sürekli paylaşarak nihai bilgiye ulaşılmasını sağlar
→ Facebook ağ üzerindeki varlığını duyurmazsa (advertising), ona erişmek mümkün olmaz
→ Her ağın bir ASN'si (Number) vardır ve yönettiği IP'lerin prefix'lerini bildirir
- 4 Ekim 15:40 UTC'den itibaren Facebook kendi DNS prefix'lerini duyurmayı bıraktı
→ Facebook'un yukarıda açıkladığı sorun nedeniyle BGP duyuruları gönderilmediği için erişim imkansız hale geldi
→ Bunun sonucunda yönlendirme değişti ve büyük çaplı BGP güncellemeleri yapıldı
→ Tüm DNS sunucuları Facebook URL'leri için SERVFAIL döndürmeye başladı
→ DNS sorguları 30 kat artmaya başladı
→ Twitter, Signal, Telegram gibi hizmetlere yönelik DNS sorguları da arttı
- 21:00 UTC'de BGP yeniden güncellendi ve her şey normale döndü
2 yorum
Facebook'ta 5 saatlik bir kesinti... gerçekten büyük bir olaymış.
BGP güvenli mi? https://tr.news.hada.io/topic?id=1932
30 Ağustos'taki CenturyLink/Level(3) internet kesintisinin analizi https://tr.news.hada.io/topic?id=2746