Hız, ölçeklenebilirlik, güvenilirlik: Google veri merkezi ağlarının 25 yıllık evrimi
(cloud.google.com)- Google’ın ağı bir gecede ortaya çıkmadı; 25 yıllık mühendislik yenilikleri ve kilometre taşlarıyla bugünkü 5. nesil Jupiter veri merkezi ağ mimarisine evrildi.
- Bugünkü Jupiter ağı, çift yönlü 13 petabit/saniye bant genişliğine kadar ölçeklenebiliyor. Bu, dünyadaki 8 milyar insanın aynı anda görüntülü görüşme yapmasına (@1.5Mb/s) yetecek bir seviye.
Temel ilkeler
- Her şey, her yerde: Google’ın veri merkezi ağı, büyük ölçekli işlerin aynı ağ fabric’i içinde 100 binden fazla sunucudan herhangi birine yerleştirilmesini destekliyor. Bu ölçek, hem iç hem dış iş yükleri için uygulama performansını artırıyor ve iç parçalanmayı ortadan kaldırıyor.
- Öngörülebilir ve düşük gecikme: Bant genişliği payı sağlanması, %99,999 ağ kullanılabilirliğinin korunması ve uç ana makinelerle fabric’in iş birliği sayesinde tıkanıklığın önceden yönetilmesi yoluyla tutarlı performans ve kuyruk gecikmesinin en aza indirilmesi önceliklendiriliyor.
- Yazılım tanımlı ve sistem odaklı: Esneklik ve çeviklik için yazılım tanımlı ağ (SDN) kullanılıyor; küresel ağ üzerinde her iki haftada bir onlarca yeni özellik doğrulanıp dünya çapında yayınlanıyor.
- Kademeli evrim ve dinamik topoloji: Kademeli evrim, ağı bütünüyle durdurmadan ayrıntı düzeyinde yenilemeyi mümkün kılıyor; dinamik topoloji ise değişen iş yükü gereksinimlerine sürekli uyum sağlamaya yardımcı oluyor. Optik devre anahtarlama ile SDN’nin birleşimi, fiziksel yükseltmeleri ve tek bir fabric içinde birden fazla donanım neslinin desteklendiği sürekli evrilen heterojen bir ağı mümkün kılıyor.
- Trafik mühendisliği ve uygulama odaklı QoS: Trafik akışının optimize edilmesi ve hizmet kalitesinin güvence altına alınması, ağın her uygulamanın gereksinimine göre uyarlanmasına yardımcı oluyor.
- Google’ın kendi SDN tabanlı Jupiter ağı, önceki nesle kıyasla 50 kattan fazla güvenilirlik sunuyor.
Evrimin tarihi
2015 - İlk petabit ağı Jupiter
- Google, ticari switch silicon, Clos topolojisi ve yazılım tanımlı ağ (SDN) kullanarak Jupiter veri merkezi ağının toplam 1.3 Pb/s bant genişliğine kadar ölçeklenebildiğini gösterdi.
- O dönemde tek bir Google veri merkezinin bu veri aktarım hızı, küresel internetin tahmini toplam IP trafik veri hızından daha yüksekti.
2022 - 6 petabit/saniye desteği
- Google, Jupiter ağının optik devre anahtarlama (OCS), dalga boyu bölmeli çoğullama (WDM) ve son derece ölçeklenebilir Orion SDN denetleyicisinin derin entegrasyonu sayesinde 6Pb/s’nin üzerine çıktığını duyurdu.
- Bu teknolojiler; kademeli ağ inşası, daha yüksek performans, maliyet düşüşü, daha düşük güç tüketimi, dinamik trafik yönetimi ve kesintisiz yükseltmeler gibi çok çeşitli gelişmeleri mümkün kıldı.
2023 - 13 petabit/saniye ağ
- Google, ağ çekirdeğinde yerel 400Gb/s bağlantı hızını desteklemek için Jupiter’i daha da geliştirdi.
- Jupiter ağının temel yapı taşı olan bileşenler (toplama blokları olarak adlandırılıyor), artık uç ana makineler ile veri merkezinin geri kalanı arasında 400Gb/s çift yönlü non-blocking bant genişliği sunan 512 porttan oluşuyor.
- Toplam çift yönlü bant genişliği olan 64*204.8 Tb/s = 13.1 Pb/s için bu bloklardan 64 tane destekleniyor.
- Bu teknoloji, bir yıldan uzun süredir Google’ın üretim veri merkezlerinde çalışıyor ve yapay zeka, makine öğrenimi, web araması ve diğer veri yoğun uygulamalardaki hızlı ilerlemeyi destekliyor.
2024 sonrası - Yapay zeka çağında uç ağ teknolojileri
- Google, gelecekte yapay zekayı destekleyecek yeni nesil ağ altyapısı için yönünü şimdiden belirlemiş durumda.
- NVIDIA ConnectX-7 ağına sahip yeni nesil GPU tabanlı A3 Ultra VM’ler için ağ altyapısı gereksinimleri üzerinde çalışılıyor.
- Bu altyapı, RoCE(RDMA over converged ethernet) üzerinden GPU’lar arası trafik için sunucu başına non-blocking 3.2 Tbps desteği sağlıyor.
- NVIDIA GB200 NVL72 tabanlı gelecekteki ürünler üzerinde de çalışmalar sürüyor.
Önümüzdeki yıllarda port/ağ genelinde bant genişliği ve ölçekte anlamlı ilerlemeler, daha güçlü uç ana makine entegrasyonu, gerçek zamanlı topoloji mühendisliği, hesaplama/depolama yığınıyla daha derin entegrasyon ve host tabanlı yük dengelemenin iyileştirilmesi sayesinde dönüştürücü uygulama ve hizmetler desteklenecek.
Henüz yorum yok.