12 puan yazan xguru 2019-07-21 | 5 yorum | WhatsApp'ta paylaş

Cloudflare’ın CTO’sunun olayın özetini ve alınan önlemleri derlediği; büyük ölçekli bir organizasyonda sorunların nasıl ortaya çıktığını ve bunlara nasıl müdahale edildiğini anlamayı sağlayan bir yazı

5 yorum

 
blurblah 2019-07-24

Orijinal metindeki appendix de ilginç. Soruna neden olan .*.*=.* deseninin CPU’yu neden tükettiğine dair ayrıntılı bir açıklama da var; düzenli ifadeyi düzeltmek iyi olsa da alternatif olarak motoru değiştirmeyi düşünmeleri de anlamlı görünüyor.

 
curioe 2019-07-21

Harika bir kesinti raporu. Nasıl müdahale ettiklerini ayrıntılı biçimde anlatmaları başlı başına etkileyici, ama bunu sadece tek bir mühendisin hatası olarak görmeyip karmaşık nedenleri bulup tek tek çözmelerinden çıkarılacak çok ders var. Bir kesinti yaşanmış olsa da, sanki şirkete duyulan güven daha da artacak gibi.

 
mytory 2019-07-23

Çok empati kuruyorum. Benim de, birden fazla nedeni işaret etmesinin etkileyici olduğunu düşünmüştüm. Bunu yalnızca tek bir mühendisin hatası olarak görmemek, bence çıkarılacak çok ders barındırıyor.

 
quake21 2019-07-22

Aynen öyle. Belki de kesinti raporlarından sorumlu bir yönetici bile vardır? Sorunların kök nedenlerini bu kadar ayrıntılı bulup analiz edebilmeleri etkileyici, ama raporu da “bu kadar ayrıntılı yazmak gerekir mi” dedirtecek kadar iyi yazmışlar.

 
lifthrasiir 2019-07-22

Bu yazıyı yazan Cloudflare CTO’su John Graham-Cumming zaten tanınmış bir blog yazarıdır. https://blog.jgc.org/