Ironwood - Çıkarım Çağı için İlk Google TPU

(blog.google)

6 puan yazan GN⁺ 2025-04-10 | 1 yorum | WhatsApp'ta paylaş

Google, 7. nesil Tensor Processing Unit (TPU) olan Ironwood'u duyurdu
Ironwood, yapay zeka çıkarımı için özel olarak tasarlanan ilk TPU ve şimdiye kadarki en güçlü ve enerji verimli model
Büyük dil modeli (LLM) ve Mixture of Experts (MoE) gibi yüksek performanslı yapay zeka modellerini çalıştırmak için tasarlandı
En fazla 9.216 çipe kadar ölçeklenebiliyor ve 42,5 exaflops işlem performansı sunuyor
Bu, dünyanın en hızlı süper bilgisayarı El Capitan'dan 24 kattan fazla performans anlamına geliyor

Önceki yapay zeka sistemleri kullanıcı isteklerine yanıt verme biçiminde çalışırken, Ironwood verileri aktif olarak yorumlayan ve içgörü üreten yapay zeka çağı için temel sağlıyor
Bu çıkarım çağında yapay zeka, kullanıcı adına veri toplayıp analiz ederek daha derin sonuçlar üretiyor
Ironwood, bu yeni yapay zeka gereksinimlerini karşılamak için büyük ölçekli paralel işleme ve yüksek hızlı veri erişimi yetenekleriyle geliyor

9.216 çipten oluşan bir TPU podu kurulduğunda, 42,5 exaflops performans sunuyor
Çip başına 4.614 TFLOPs performansla büyük ölçekli LLM ve MoE modellerinin eğitimi ile çıkarımını destekliyor
Geliştirilmiş SparseCore özelliği, devasa embedding işlemlerini hızlandırıyor ve finans, bilim gibi çeşitli alanlara uygulanabiliyor
Pathways yazılımı üzerinden on binlerce Ironwood çipi verimli biçimde yönetilebiliyor

Performans / güç verimliliği oranı önceki nesle göre 2 kat iyileştirildi
- Trillium'a kıyasla yaklaşık 30 kat daha yüksek güç verimliliği
- Yüksek performanslı sıvı soğutma teknolojisi sayesinde sürekli yüksek yük altında da kararlı performans korunuyor
Yüksek bant genişlikli bellek (HBM) kapasitesi büyük ölçüde artırıldı
- Çip başına 192 GB, Trillium'a göre 6 kat artış
- Büyük modeller ve veri kümelerini işlemek için avantaj sağlıyor
HBM bellek bant genişliği artırıldı
- Çip başına 7,2 TBps, Trillium'a göre 4,5 kat artış
Inter-Chip Interconnect (ICI) bant genişliği iyileştirildi
- 1,2 Tbps çift yönlü, Trillium'a göre 1,5 kat artış
- Çipler arası hızlı iletişim sayesinde büyük ölçekli dağıtık eğitim ve çıkarım için uygun

Ironwood, Google Cloud Hypercomputer mimarisinin temel bileşenlerinden biri olarak yeni nesil üretken yapay zeka ihtiyaçları için optimize edildi
Gemini 2.5 ve AlphaFold gibi en yeni yapay zeka modelleri de TPU tabanında çalışıyor
Google Cloud müşterileri Ironwood sayesinde yapay zeka iş yüklerini yüksek performans, düşük gecikme ve artırılmış enerji verimliliği ile çalıştırabilecek
2025 içinde müşterilerin kullanımına sunulması planlanıyor ve yapay zeka araştırmaları ile gerçek dünya uygulamalarında yeni inovasyonların temelini atması bekleniyor

1 yorum

iwanhae 2025-04-10

Demek ki son zamanlarda Gemini'nin ilk token'a ulaşma süresi ezici biçimde hızlı diye düşünmemizin bir sebebi varmış...