2 puan yazan GN⁺ 2025-04-24 | 3 yorum | WhatsApp'ta paylaş
  • NVIDIA, yapay zeka patlaması ve GPU tekelinin etkisiyle hızla büyüdü; ancak bulut devlerinin kendi çiplerini geliştirmesi ve dikey entegrasyon stratejileri nedeniyle uzun vadeli konumu tehdit altında
  • Startup ve bağımsız bulut sağlayıcılarının GPU talebi azalıyor; NVIDIA bağımlılığı yüksek iş modellerinde kârlılık bozulması görünür hale geliyor
  • Google, Amazon, Microsoft ve Meta, yüksek performanslı özel çipler ile dikey entegre sistemler üzerinden NVIDIA’ya bağımlılıklarını hızla azaltıyor
  • Dağıtık altyapı ve küme bağlantısı tabanlı optimizasyon, yapay zeka eğitiminin temel unsurları haline geliyor; bu da NVIDIA’nın yanıt vermekte zorlanacağı yapısal bir değişime işaret ediyor
  • NVIDIA donanım ve yazılım tarafında iyileştirmeler yapmaya çalışsa da, hiperscaler’ların derin dikey entegrasyon stratejileri karşısında rekabet gücünün zayıflama ihtimali bulunuyor

NVIDIA’nın hakimiyetinden krize: yapay zeka hesaplama pazarındaki sarsıntı

  • NVIDIA, yapay zeka patlaması, GPU tekeli ve DGX sunucu tedariki sayesinde hızla büyüyerek 13 ay içinde piyasa değerine 2 trilyon dolar eklenmesi gibi rekor bir başarı elde etti
  • Ancak H100 nesli kârlılığın zirvesini temsil ediyor; sonrasında çıkan B200 serisine ise kârlılıkta gerileme ve artan üretim maliyetleri eşlik ediyor
  • Uzun vadede hiperscaler’lar talebi konsolide edip özel çip geliştirme yoluyla rekabet avantajı kazandıkça, NVIDIA’nın tekel yapısı sarsılıyor

Yapay zeka talebinin yeniden şekillenmesi ve startup pazarının daralması

  • NVIDIA’nın veri merkezi talebinin yarısından fazlası Google, Microsoft, Amazon ve Meta gibi hiperscaler’lardan geliyor
  • Kalan talep startup’lar, VC’ler ve orta-küçük ölçekli bulut şirketlerinden geldi; ancak aşırı GPU alımı nedeniyle ROI düşük ve GPU kiralama işi zarar yazıyor
  • BloombergGPT gibi küçük ölçekli özelleşmiş modeller pazarda zorlanırken, kapalı büyük API tabanlı modeller standart hale geliyor
  • Coreweave ve Lambda gibi bağımsız bulut şirketleri, NVIDIA’nın desteğine rağmen ekonomik yetersizlik, düşen kârlılık ve yavaşlayan talep nedeniyle kriz yaşıyor
  • GPU kiralama fiyatları sert biçimde düştü; saatlik $1.99 seviyesine gerilerken ROE %10’un altına indi ve bu seviye sürdürülebilir değil

Hiperscaler’ların özel çip geliştirme stratejisi

  • Google TPU zaten 6. nesle ulaştı ve Gemini-Ultra, DeepMind ve YouTube gibi modellerde NVIDIA’nın yerini tamamen aldı
  • Amazon’un Trainium ve Inferentia çipleri, Anthropic ile iş birliği sayesinde büyük model çıkarımı ve eğitiminin yerini alıyor; ayrıca CUDA olmadan çalışan Neuron SDK sunuyor
  • Microsoft’un Maia hızlandırıcısı ve Cobalt CPU’su, şirket içi yapay zeka iş yüklerinde kullanılıyor; Triton tabanlı SDK ile CUDA’nın yerini alma ihtimalini artırıyor
  • Meta, MTIA çipiyle Instagram ve WhatsApp’ın yapay zeka özelliklerini kendi çipleri üzerinde çalıştırıyor; ayrıca Llama 3.1 eğitiminin bir kısmını da kendi çiplerine dayalı olarak yürütüyor
  • Bu eğilim, çıkarım merkezli yapay zeka pazar yapısına daha uygun ve gelecekte GPU tabanlı çıkarımın özel çiplere, hatta CPU tabanlı çözümlere karşı gerileme ihtimali var

Sistem merkezli yapıya geçiş ve NVIDIA’nın sınırları

  • Hiperscaler’lar tek bir çipin performansından çok tüm sistemin optimizasyonuna odaklanıyor
  • Google, küçük TPU’ları büyük ölçekte birbirine bağlayarak, kendi optik ağı (Apollo) ve torus ağ topolojisini kullanıp güç tüketimini ve gecikmeyi en aza indiriyor
  • Microsoft, fiber ağ ve ColorZ transceiver’ları kurarak çoklu veri merkezi eğitimi olanağı sağlıyor ve NVIDIA’ya kıyasla daha düşük maliyetli, yüksek performanslı altyapı elde ediyor
  • Bunun sonucunda, birden fazla küçük veri merkezini ağ üzerinden bağlayarak eğitim yapan dağıtık mimari öne çıkan model haline geliyor
  • Güç kısıtlarını ve altyapı genişleme sınırlarını aşmak için ülke çapında veri merkezi bağlantıları kurulmaya çalışılıyor (ör. Microsoft’un Three Mile Island’ı yeniden devreye alma girişimi, AWS’nin nükleer santral satın alımı)

NVIDIA’nın donanım-yazılım yanıtı ve yapısal zorluklar

  • NVIDIA, GB200 sunucuları, Spectrum-X, DCGM ve RAS ile karşılık vermeye çalışıyor
  • InfiniBand tabanlı ağ tasarımı, büyük ölçekli kümelerde zayıf kalıyor ve hata toleranslı tasarım açısından eksikler taşıyor
  • Google’ın Pathways’i ve Microsoft’un Singularity’si, kendi fault-tolerant sistemleri ve GPU bellek hatası tespiti konularında güçlü yönlere sahip
  • Kubernetes tabanlı NVIDIA BaseCommand, hiperscaler’ların Borg, MegaScaler gibi sistemleriyle karşılaştırıldığında ölçeklenebilirlik ve entegrasyon açısından geride kalıyor
  • Soğutma sistemlerinde geç kalan oyuncu olarak NVIDIA, Google’a kıyasla enerji verimliliği, ömür ve alan verimliliğinde de geride (ör. Google PUE 1.1, NVIDIA ise 1.4 ve üzeri)

Sonuç

  • NVIDIA hâlâ güçlü GPU performansına sahip; ancak sistem optimizasyonu, altyapı entegrasyonu ve maliyet verimliliği alanlarında hiperscaler’ların gerisinde kalmasına yol açan yapısal sınırlamalar bulunuyor
  • Hiperscaler’lar, çipten altyapıya ve yazılıma kadar dikey entegrasyonu zaten tamamlayarak tam ikame olasılığını elde etmiş durumda
  • NVIDIA, geçmişteki GPU merkezli stratejiden çıkıp tüm sistemi kapsayan yenilikler yapmadığı takdirde, gelecekte yapay zeka hesaplama pazarında sürdürülebilir liderliğini korumakta zorlanma riskiyle karşı karşıya

3 yorum

 
kandk 2025-04-24

Google Tensor, Tesla Dojo, AMD yüzünden Nvidia hissesi almayan biri..

 
kimjoin2 2025-04-24

"Hyperscaler'ların özel çipleri"nin dezavantajlarını da merak ediyorum
Sanki her açıdan daha üstünmüş gibi anlatılıyor gibi geliyor

 
GN⁺ 2025-04-24
Hacker News görüşleri
  • Nvidia hiçbir şey yapmazken rakiplerin birdenbire başarıya ulaşıp Nvidia’yı tehdit edeceği varsayımına dayanan bir başka yazı olduğu görüşü var

    • Nvidia hakkındaki karamsarların bir gün haklı çıkabileceği, ancak şimdiye kadar çoğu zaman yanıldıkları belirtiliyor
  • Marvell’in hissesi bu yıl %50’den fazla düşmüş olsa da Nvidia GPU’larına olan talep hâlâ güçlü

    • Bulutun sunduğu yeteneklerin GPU’ların yerini alamayacağı vurgulanıyor
    • Jensen’in Nvidia’nın 10 trilyon dolarlık bir şirket olacağı yönündeki vizyonuna katılınıyor
    • Nvidia’nın AI phone, rakip LLM servisleri, AI PC, otonom araçlar, robotlar vb. çıkarma olasılığından söz ediliyor
    • Warren Buffet’ın Google ve Apple’a yatırım yapmamış olmaktan duyduğu pişmanlığa benzer şekilde, bugün de benzer bir durum yaşandığı düşünülüyor
  • Servislerin Nvidia’yı koruyacağı görüşü var

    • CUDA, Infiniband, NGC, NVLink gibi unsurlarla ekosistemin sahibi olduğu ve AI Foundry gibi ek uygulamalarla bunu genişletmesi gerektiği belirtiliyor
    • Özel tasarımlar ve GPU proje danışmanlığı yoluyla pazar yavaşladığında gelir yaratabileceği söyleniyor
  • Nvidia’nın stratejik konumunun hafife alındığı görüşü var

    • Nvidia’nın donanım oyununu sonsuza kadar kazanmak zorunda olmadığı, tüm AI stack’ini inşa ettiği belirtiliyor
    • Donanım, ağ, yazılım, model ve geliştirici araçlarını kapsamlı biçimde sunan tek şirket olduğu ifade ediliyor
    • Nvidia’nın entegre bir platform kurduğu ve bunun sektör standardı hâline geleceği söyleniyor
  • AMD’nin Nvidia ile gizli bir anlaşma yaptığı ve bu durumu bilerek oluşturduğu yönünde bir görüş var

    • Nvidia’nın TSMC’de Apple ile ayrıcalıklı konumu paylaştığı belirtiliyor
  • Nvidia işlevsel bir tekelden rekabet etmek zorunda olduğu bir duruma geçiyor

    • Bunun ideal olmadığı ancak ölümcül bir darbe de olmadığı söyleniyor
  • H100 neslinin en yüksek fiyatlandırma gücünü temsil ettiği ve alternatif azlığı nedeniyle gelir üretmeye devam edeceği görüşü var

    • Uzun vadeli dayanıklılığı konusunda soru işaretleri bulunuyor
    • Hyperscaler’ların AI talebini konsolide ettiği ve rekabetçi çipler geliştirdiği belirtiliyor
    • Büyük GPU çiftlikleri kuran başka şirketlerin de olduğu söyleniyor
  • Nvidia’nın GPU sürücülerindeki kalite kontrolünün kötüleştiği görüşü var

    • Ancak ürünler yıllardır tükendiği için bunu kalite kontrolün kötü olduğu şeklinde görmek zor deniyor