-
Intel Gaudi 3 yapay zeka hızlandırıcısına giriş
- Intel Gaudi 3 yapay zeka hızlandırıcısı, 9 Nisan 2024’te Arizona, Phoenix’te düzenlenen Intel Vision etkinliğinde tanıtıldı
- BF16 için 4 kat yapay zeka işlem performansı ve önceki nesle kıyasla 1,5 kat daha fazla bellek bant genişliği sunuyor
- Genel amaçlı topluluk tabanlı yazılım ve sektör standardı Ethernet ile müşterilere seçim özgürlüğü sunuyor ve sistemlerin daha esnek biçimde ölçeklenmesini destekliyor
-
Gaudi 3 neden önemli
- Finans, üretim ve sağlık gibi temel sektörlerdeki şirketler yapay zekaya erişimi genişletiyor ve üretken yapay zeka (GenAI) projelerini deney aşamasından büyük ölçekli uygulama aşamasına hızla taşıyor
- Bu geçişi yönetmek, inovasyonu hızlandırmak ve gelir artışı hedeflerini gerçekleştirmek için açık, maliyet açısından verimli ve enerji verimliliği yüksek çözüm ve ürünlere ihtiyaç duyuluyor
- Intel Gaudi 3 hızlandırıcısı bu gereksinimleri karşılamayı hedefliyor ve açık topluluk tabanlı yazılım ile açık sektör standardı Ethernet üzerinden çeşitlilik sunarak şirketlerin yapay zeka sistemlerini ve uygulamalarını esnek biçimde ölçeklendirmesine yardımcı olacak
-
Özel mimari GenAI performansı ve verimliliğini nasıl sağlıyor
- Intel Gaudi 3 hızlandırıcısı, verimli büyük ölçekli yapay zeka işlemleri için tasarlandı ve 5nm süreçte üretilerek önceki nesle göre önemli bir ilerleme sağladı
- Tüm motorların paralel olarak etkinleştirilebilmesi için tasarlandı; bu da hızlı ve verimli derin öğrenme işlemleri ile ölçekleme için gereken hızlandırmayı mümkün kılıyor
- Başlıca özellikler:
- Yapay zekaya özel işlem motoru: 64 adet yapay zekaya özel programlanabilir TPC ve 8 adet MME’den oluşan heterojen işlem motoru içeriyor
- LLM kapasite gereksinimleri için bellek artışı: 128GB HBM2e bellek, 3.7TB bellek bant genişliği ve 96MB yerleşik SRAM sunuyor
- Kurumsal GenAI için verimli sistem ölçeklendirme: esnek ve açık standart ağ yapısı sağlayan 24 adet 200Gb Ethernet portunu entegre ediyor
- Geliştirici üretkenliği için açık sektör yazılımı: PyTorch framework entegrasyonu ve optimize edilmiş Hugging Face topluluk tabanlı modeller sunuyor
- Gaudi 3 PCIe eklentisi: ince ayar, çıkarım ve retrieval-augmented generation (RAG) için ideal yeni bir form faktörü
-
Pazar benimsemesi ve erişilebilirlik
- Intel Gaudi 3 hızlandırıcısının 2024’ün 2. çeyreğinde OEM’lere Universal Baseboard ve Open Accelerator Module (OAM) için sektör standardı yapılandırmalarla sunulması planlanıyor
- Dell Technologies, Hewlett Packard Enterprise, Lenovo ve Supermicro gibi büyük OEM’lerin benimsemesi bekleniyor
- Intel Gaudi 3 hızlandırıcısının genel kullanıma sunulmasının 2024’ün 3. çeyreğinde, Intel Gaudi 3 PCIe eklenti kartlarının ise 2024’ün 4. çeyreğinde gerçekleşmesi bekleniyor
- NAVER dahil olmak üzere maliyet açısından verimli çeşitli bulut LLM altyapılarında Intel Gaudi 3 hızlandırıcısının kullanılması planlanıyor
-
Gelecek planları
- Intel Gaudi 3 hızlandırıcısının yakaladığı ivme, Intel’in yapay zeka ve HPC için yeni nesil GPU’su Falcon Shores’un temelini oluşturacak
- Falcon Shores’un Intel Gaudi ve Intel Xe IP’yi birleştirmesi ve Intel oneAPI spesifikasyonuna dayalı tek bir GPU programlama arayüzü sunması bekleniyor
GN⁺ görüşü
- Intel Gaudi 3, Nvidia H100 ve H200 gibi başlıca rakip ürünlere kıyasla GenAI model eğitimi ve çıkarım performansında kayda değer iyileşmeler gösteriyor. Bu, onun yapay zeka pazarında Nvidia’nın fiili tekel konumuna meydan okuyabilecek bir alternatif olarak konumlanmasını sağlayabilir
- Açık yazılım ve standart tabanlı ölçeklenebilirlik desteği, şirketlerin maliyet verimliliğine ve vendor lock-in riskinin azaltılmasına katkı sağlayabilir. Özellikle yapay zeka sistemlerini büyük ölçekte kurmak isteyen şirketler için cazip bir seçenek olabilir
- Ancak Intel son yıllarda CPU pazarındaki rekabet gücünün zayıflaması ve ürün lansmanlarındaki gecikmeler gibi zorluklar yaşadı. Gaudi 3’ün planlandığı gibi piyasaya çıkıp çıkmayacağı ve müşteri tarafında geniş çaplı benimsenip benimsenmeyeceği izlenmeye değer
- AMD Instinct MI300 gibi rakip ürünlerin de yapay zeka yarı iletken pazarına çıkmaya hazırlanmasıyla rekabetin daha da yoğunlaşması bekleniyor. Belirleyici unsur yalnızca teknik üstünlük değil, yazılım ekosistemi kurma ve müşteri kazanımı da olacak gibi görünüyor
1 yorum
Hacker News görüşleri