- Slack, son 1,5 yılda yedekliliği artırmak ve site arızalarının etkisini sınırlamak için tekil yapıdan hücre tabanlı bir yapıya (
Cellular Architecture) geçti
- Bu geçiş, Haziran 2021'deki bir ağ kesintisinin Slack müşterilerinde hizmet bozulmasına yol açmasının ardından Slack hizmetinin dayanıklılığını artırma ihtiyacıyla yönlendirildi
- Hücresel yapı, her hizmetin kullanılabilirlik bölgesi (AZ) başına bir sanal hizmet olarak çalışmasını sağlayarak bir AZ'deki arızanın diğer AZ'leri etkilememesini sağlıyor
- Ayrıca sorunlu AZ'deki trafiği boşaltma (
drain) özelliğini de içeriyor; bu sayede söz konusu AZ sistemin geri kalanından etkili biçimde izole ediliyor
- Boşaltma mekanizması; hızlı, hatasız, kademeli ve boşaltılan AZ'nin kaynaklarından bağımsız olacak şekilde tasarlandı
- Hücresel yapıya geçiş, hizmetlerin yalnızca kendi AZ'leri içinde trafik alıp göndermesini sağlayan
siloing adlı bir stratejiyi de içeriyor. Bu, tek bir AZ içindeki tüm arızaların sınırlandırılmasına yardımcı oluyor
- Trafik taşıma mekanizmasının uygulanması, kullanıcı sorgularını çekirdek hizmetlere yönlendiren sisteme odaklandı
- Yeni yapı, AZ boşaltmayı desteklemek için Envoy'un weighted clusters özelliği ile RTDS üzerinden dinamik ağırlık atamasından yararlanıyor
- Bu geçiş, Slack'in çalışma biçimini ve hizmetlerini kurma şeklini değiştirdi; trafik yönetimi ve arıza azaltımı için güçlü yeni araçlar sundu
- Gelecekteki blog yazılarında teknik uygulama ayrıntıları daha derinlemesine ele alınacak ve yeni yapının Slack'in operasyonlarını nasıl etkilediği tartışılacak
1 yorum
Hacker News görüşleri