Nvidia, H200 Tensor Core GPU'yu duyurdu
(nvidia.com)Dünyanın en güçlü GPU'su
- NVIDIA H200 Tensor Core GPU, oyunun kurallarını değiştiren performansı ve bellek kapasitesiyle üretken yapay zeka ve yüksek performanslı hesaplama (HPC) iş yüklerini hızlandırıyor.
- HBM3e ile gelen ilk GPU olan H200, üretken yapay zeka ve büyük dil modellerinin (LLM'ler) hızlandırılması ile bilimsel hesaplama için HPC iş yüklerini ileri taşıyor.
NVIDIA Hopper mimarisi tabanlı performans artışı
- NVIDIA Hopper™ mimarisini temel alan NVIDIA HGX H200, büyük ölçekli verileri işlemek için gelişmiş belleğe sahip NVIDIA H200 Tensor Core GPU'yu öne çıkarıyor.
Performans artışını deneyimleyin
- Llama2 70B çıkarımı 1,9 kat, GPT-3 175B çıkarımı ise 1,6 kat daha hızlı.
- Yüksek performanslı hesaplama, CPU'ya kıyasla 110 kata kadar daha hızlı.
Daha yüksek performans ve daha büyük, daha hızlı bellek
- NVIDIA H200, 141GB HBM3e bellek ve 4,8TB/s bellek bant genişliği sunarak üretken yapay zeka ve LLM'leri hızlandırıyor, enerji verimliliğini artırıyor ve toplam sahip olma maliyetini düşürüyor.
Yüksek performanslı LLM çıkarımıyla içgörü elde edin
- Yapay zeka çıkarım hızlandırıcıları, büyük kullanıcı tabanlarına dağıtıldığında en yüksek verim ve en düşük TCO'yu sağlamalıdır.
- H200, LLM'leri işlerken H100 GPU'ya kıyasla 2 kata kadar daha hızlı çıkarım hızı sunuyor.
Yüksek performanslı hesaplamayı hızlandırın
- Bellek bant genişliği HPC uygulamaları için kritik öneme sahiptir; daha hızlı veri aktarımı sağlar ve karmaşık işleme darboğazlarını azaltır.
- H200'ün yüksek bellek bant genişliği, veri erişimi ve işlenmesini daha verimli hale getirerek CPU'ya kıyasla 110 kata kadar daha hızlı sonuç elde edilmesini sağlıyor.
Enerji ve TCO tasarrufu
- H200'ün devreye alınmasıyla enerji verimliliği ve TCO yeni bir seviyeye ulaşıyor.
- Aynı güç profili içinde üstün performans sunarken daha çevreci ve daha ekonomik avantajlar sağlıyor.
Performans
- NVIDIA Hopper mimarisi, benzeri görülmemiş performans artışları sunuyor ve H100 için süren yazılım iyileştirmeleriyle performans çıtasını yükseltmeye devam ediyor.
- H200'ün kullanıma sunulması, desteklenen yazılımlardaki sürekli iyileştirmelerle daha fazla performans artışını beraberinde getirerek bugün ve gelecekte performans liderliğini güvence altına alıyor.
Kurumsal kullanıma hazır: Yapay zeka yazılımı geliştirme ve dağıtımı basitleştiriyor
- NVIDIA AI Enterprise ile birlikte NVIDIA H200, yapay zeka hazırlıklı platformların kurulmasını basitleştiriyor; üretken yapay zeka, bilgisayarlı görü ve sesli yapay zeka gibi alanlarda geliştirme ve dağıtımı hızlandırıyor.
- Bunlar kurumsal düzeyde güvenlik, yönetilebilirlik, kararlılık ve destek sağlayarak daha hızlı eyleme dönüştürülebilir içgörüler elde etmeyi ve somut iş değeri yaratmayı mümkün kılıyor.
NVIDIA H200 Tensor Core GPU teknik özellikleri
- Form faktörü: H200 SXM
- FP64: 34 TFLOPS
- FP64 Tensor Core: 67 TFLOPS
- FP32: 67 TFLOPS
- TF32 Tensor Core: 989 TFLOPS
- BFLOAT16 Tensor Core: 1,979 TFLOPS
- FP16 Tensor Core: 1,979 TFLOPS
- FP8 Tensor Core: 3,958 TFLOPS
- INT8 Tensor Core: 3,958 TFLOPS
- GPU belleği: 141GB
- GPU bellek bant genişliği: 4,8TB/s
- Kod çözücü: 7 NVDEC
- Maksimum termal tasarım gücü (TDP): en fazla 700W (yapılandırılabilir)
- Çoklu örnek GPU: her biri 16.5GB olmak üzere en fazla 7 MIG
GN⁺ görüşü
Bu haberdeki en önemli nokta, NVIDIA'nın H200 Tensor Core GPU ile yapay zeka ve HPC iş yükleri için dünyanın en güçlü GPU'sunu tanıtmış olmasıdır. Bu GPU'nun, üretken yapay zeka ve büyük dil modellerinin hızlandırılmasının yanı sıra bilimsel hesaplama için HPC iş yüklerinin gelişimine de katkı sağlaması bekleniyor. Bu tür teknolojik ilerlemeler, kariyerinin başındaki yazılım mühendisleri için de ilgi çekici olacaktır ve üzerinde çalıştıkları projelerde yenilikçi değişimler yaratma potansiyeli taşımaktadır. H200'ün gelişmiş bellek ve işlem kapasitesinin daha hızlı hesaplama, daha yüksek enerji verimliliği ve daha düşük TCO sağlayarak yapay zeka ile bilimsel araştırma alanlarındaki ilerlemeyi hızlandırması öngörülüyor.
1 yorum
Hacker News görüşleri
H200 GPU kalıbı H100 ile aynı, ancak genel olarak daha hızlı 24GB bellek yığınları kullanıyor.
Diğer çip üreticilerinin birkaç yıl içinde yapay zeka alanında NVIDIA'yı yakalama veya geçme ihtimali üzerine merak.
NVIDIA'nın kısa sürede sağladığı performans artışı etkileyici, ancak bu alanda başka rakiplere ihtiyaç olduğu hissediliyor.
Çıkarımda kullanılan metriklere dair soru ve eğitim tarafında da benzer performans artışlarının beklenip beklenmemesi gerektiği.
Aynı yıl çıkacak B100 ile kıyaslandığında H200'ün konumu üzerine soru işareti.
H100 GPU'nun fiyatı karşısında şaşkınlık ve kişisel deneyler ile hackathon'larda kullanmak istendiğinde maliyetin ne olacağına dair soru.
Mobil cihazlarda web sayfasındaki çerez banner'ları ve reklam banner'ları nedeniyle gerçekten görülebilen ekran alanı çok sınırlı.
"GPU" terimi hakkında bir açıklama yok ve yerleşik video çıkış özelliği hiç bulunmuyor.
Fotoğrafta ne olduğunun açıklanması isteniyor ve bunun sanki Blade Runner'dan çıkmış bir şehir ya da bina gibi göründüğü söyleniyor.
Çıkarım hızının sınırının bellek bant genişliği mi yoksa hesaplama gücü mü olduğu soruluyor.