1 puan yazan GN⁺ 2 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • HBM, Nvidia, AMD, Google ve Amazon yapay zeka çiplerinin üretim hacmi ağırlıklı ortalamasına göre 2024'ün 1. çeyreğinde %52 iken 2025'in 4. çeyreğinde %63'e yükseldi
  • Aynı dönemde mantık kalıbı payı yaklaşık %13 ile neredeyse sabit kaldı; gelişmiş paketleme %19'dan %15'e, yardımcı bileşenler ise %15'ten %9'a geriledi
  • Dört tasarımcının HBM harcaması, 2024'te yaklaşık 12 milyar dolardan 2025'te 32 milyar dolara çıktı ve diğer bileşenlere kıyasla yıllık bazda daha hızlı arttı
  • Toplam yapay zeka çipi bileşen harcaması yaklaşık 22 milyar dolardan 52 milyar dolara yükseldi ve yalnızca HBM yaklaşık 20 milyar dolarlık artışı oluşturdu
  • 2026'da bellek arz sıkıntısı ve fiyat artışları nedeniyle maliyet baskısı daha da artabilir; Microsoft ve Meta da yükselen bileşen fiyatlarını sermaye harcamalarındaki artışın nedenleri arasında gösterdi

Temel değişim

  • Yüksek bant genişlikli bellek (HBM), yapay zeka çipi bileşen harcamaları içindeki payını 2024'ün 1. çeyreğinde %52'den 2025'in 4. çeyreğinde %63'e çıkardı
  • Bu tahmin, Nvidia, AMD, Google ve Amazon tarafından tasarlanan tüm yapay zeka çipleri için üretim hacmi ağırlıklı ortalamaya dayanıyor
  • Aynı dönemde mantık kalıpları yaklaşık %13 seviyesinde neredeyse değişmeden kaldı; gelişmiş paketleme %19'dan %15'e, yardımcı bileşenler ise %15'ten %9'a düştü
  • Dört tasarımcının HBM harcaması 2024'te yaklaşık 12 milyar dolardan 2025'te 32 milyar dolara yükseldi ve diğer bileşenlere göre yıllık bazda daha hızlı arttı
  • Toplam yapay zeka çipi bileşen harcaması 2024'te yaklaşık 22 milyar dolardan 2025'te yaklaşık 52 milyar dolara çıktı ve HBM harcaması tek başına yaklaşık 20 milyar dolarlık artışı oluşturdu

2026'da maliyet baskısı

Hesaplama yöntemi ve veri kapsamı

  • Nvidia, AMD, Google ve Amazon tarafından tasarlanan her yapay zeka çipi için bellek, mantık kalıbı, gelişmiş paketleme ve yardımcı bileşenlerin çip başına maliyeti tahmin edildi
  • Her çipin bileşen maliyeti, çeyreklik tahmini üretim miktarıyla çarpılarak kategori bazında toplam bileşen harcaması hesaplandı; ardından 2024'ün 1. çeyreğinden 2025'in 4. çeyreğine kadar toplam bileşen harcaması içindeki payı çıkarıldı
  • Bileşen maliyeti tahminleri AI Chip Components explorer kaynağından alındı; finansal açıklamalar, tedarikçi verileri ve analist raporları temel alınarak çip düzeyinde bileşen dökümleri oluşturuldu
  • Ayrıntılı metodolojiye explorer’s methodology documentation üzerinden ulaşılabilir

Bileşen kategorileri

  • Bellek

    • HBM yığınları dahildir; HBM3 ve HBM3e kapsanır
  • Mantık

    • 3~5nm ileri üretim süreci mantık kalıpları dahildir
  • Paketleme

    • TSMC CoWoS gelişmiş paketleme dahildir
  • Yardımcı bileşenler

    • Alt katman, güç beslemesi ve mantık ya da bellek dışındaki diğer giriş bileşenleri dahildir

Belirsizliğin ele alınışı

  • HBM yığını fiyatı, mantık kalıbı fiyatı ve CoWoS paket fiyatı gibi her bileşenin birim maliyetinde maliyet belirsizliği bulunuyor
  • Her çipin bileşen bazlı maliyeti %90 güven aralığıyla modellendi
  • Bileşen payı, ilgili bileşen maliyetinin toplam maliyete bölünmesiyle bulunduğundan, hem pay hem de payda belirsizdir
  • İki tür aralık birlikte sunuluyor
    • Yalnızca ilgili bileşen maliyetinin değiştiği aralık: İlgili bileşen maliyeti 5. veya 95. yüzdelikteyken diğer üç bileşen ortanca değerde kabul edildiğinde ortaya çıkan pay
    • Tüm bileşenlerin uç değerlere gittiği aralık: İlgili bileşen güven aralığının bir ucundayken, diğer tüm bileşenler aynı anda karşı uçta olduğunda ortaya çıkan pay

Çeyreklik bileşen payları

  • 2024'ün 1. çeyreği

    • Bellek payı %52 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %48~56, tüm bileşenler uç değerlere gittiğinde ise %42~62 aralığındaydı
    • Mantık payı %14 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %12~17, tüm bileşenler uç değerlere gittiğinde ise %10~20 aralığındaydı
    • Paketleme payı %19 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %14~24, tüm bileşenler uç değerlere gittiğinde ise %12~27 aralığındaydı
    • Yardımcı bileşen payı %15 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %13~18, tüm bileşenler uç değerlere gittiğinde ise %11~21 aralığındaydı
  • 2025'in 4. çeyreği

    • Bellek payı %63 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %60~67, tüm bileşenler uç değerlere gittiğinde ise %54~73 aralığındaydı
    • Mantık payı %13 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %10~16, tüm bileşenler uç değerlere gittiğinde ise %9~19 aralığındaydı
    • Paketleme payı %15 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %11~19, tüm bileşenler uç değerlere gittiğinde ise %9~22 aralığındaydı
    • Yardımcı bileşen payı %10 idi; yalnızca ilgili bileşen maliyeti değiştiğinde %8~10, tüm bileşenler uç değerlere gittiğinde ise %7~12 aralığındaydı

Varsayımlar ve sınırlamalar

  • Bileşen maliyetleri sözleşmeye, tedarikçiye ve zamana göre değişebileceğinden çip başına maliyet tahminlerinde belirsizlik vardır
  • Çeyreklik çip üretim miktarı tahminlerinde ve çip türü bileşiminde de belirsizlik bulunur; bu belirsizlik raporlanan paylara yansıtılmıştır

Veri ve keşif aracı

1 yorum

 
GN⁺ 2 시간 전
Hacker News yorumları
  • Yapay zeka çıkarımı ve eğitimi için, hiç teknik yenilik olmasa bile donanım maliyetlerini yaklaşık 3 kat, toplam maliyetleri ise yaklaşık 2 kat düşürebilecek bir yol var gibi görünüyor
    Bunun için yalnızca DRAM arzının talebi yakalaması gerekiyor; ister üretim kapasitesi artırılsın ister mevcut üretim hızıyla talep patlaması karşılanmaya çalışılsın, mesele sadece zaman gibi duruyor

    • Mevcut en ileri çiplerin kıtlığı nedeniyle oluşan Nvidia kâr marjları da hesaba katılırsa, maliyet düşüşü için alan çok daha büyük olabilir
      Sam Altman'ın kültürel olarak yaydığı sözlerde eleştirilecek çok şey var, ama uzun vadeden bakınca “şu an, bundan sonra gelecek zamanların en kötüsü” sözü oldukça ilginç ve küçümsenen bir nokta gibi geliyor
      10 yıl sonra bugünkü seviyede bir LLM eğitmek, bugün veritabanı işletmek kadar temel bir varsayım haline gelebilir. Mevcut seviye de zaten oldukça ileri; donanım gelişiminden bağımsız olarak yalnızca daha iyi pekiştirmeli öğrenme eğitim düzenekleri kurulsa bile daha fazla ilerleme alanı olduğunu düşünüyorum
      Allen Institute'un GitHub ve HF projelerine mutlaka bakmanızı öneririm. Common Crawl ile sıfırdan LLM eğitmeye yönelik materyaller ve qwen için ilginç ayarlar gibi açık kaynak eğitim kaynakları var; yakında öğleden sonra yapılacak projelerin ya da eğitim materyallerinin nasıl görüneceğine dair bir fikir veriyor
    • Bellek şirketleri, talebe uyacak şekilde arzı büyük ölçüde artırmayacaktır
      Bu sektör, piyasayı arz açığı durumunda tutma eğilimindedir; aksi halde ardından gelen arz fazlası şirketleri zor durumda bırakır. Bunun yerine mobil ve kişisel bilişim gibi daha düşük kârlı alanlardaki arz, daha yüksek kârlı alanlara kaydırılır
    • Sam Altman'ın bellek pazarını ele geçirmeye yönelik ustaca hamlesi, sanki beklenmedik sonuçlar doğurmuş gibi görünüyor
    • Acaba kayan nokta biçimlerinin benimsenmesi artacak mı diye merak ediyorum
      IEEE kayan nokta, düşük bit genişliklerinde, özellikle de 16 bit ve altında, kötü bir üne sahip. Posit gibi biçimler 16 bit ya da 8 bitte çok daha iyi. Değer başına 32 bit yerine 16 bitle eğitim yapmak mümkün olur ve IEEE32'den IEEE16'ya geçerken olduğundan çok daha az doğruluk kaybı yaşanırsa bu oldukça anlamlı olur
    • Sermaye harcaması bileşenleri olarak “GPU” modüllerinin ya da üzerlerine lehimlenmiş DRAM'in ömrü ve yenilenebilirliği ne kadar, merak ediyorum
  • Birkaç yıl önce 96GB RAM'i yaklaşık 250 dolara almıştım, şimdi aynı RAM 1200 dolar

    • Geçen yıl 22 Ekim'de Crucial 96GB DDR5 5600MHz SO-DIMM RAM'i 279 dolara aldım
      Amazon'da aynı kit şu anda 1.048,90 dolar
    • Fırsat varken ana sunucumu tam kapasite doldurmamış olmama çok kızıyorum
      İkinci el kurumsal bellek modülleri eBay'de gerçekten sudan ucuzdu
    • 1 yıl önce 192GB DDR3'ü kelimenin tam anlamıyla 60 dolara, modül başına 5 dolara aldım
      Şimdi modül başına yaklaşık 22 dolar, yani toplamda yaklaşık 350 dolar ediyor. Kim DDR3 ile ne yapıyor gerçekten bilmiyorum
    • Onlarca GB RAM'in ucuza bulunabileceği varsayımı tamamen çöktü
      Optane gibi çok hızlı SSD'lerin değeri çok daha fazla artabilir
    • Garajı toplarken kullanılmamış iki adet Samsung EVO 4TB sürücü buldum
  • Okuduğum her yerde RAM kapasitesinin yılda %20~25 artacağı söyleniyor ama bu yeterli görünmüyor
    Tüketici kullanımında bile telefonlar ve dizüstüler RAM iki katına çıksa ciddi biçimde daha iyi olurdu; yapay zeka talebinin ise ne kadar büyük olduğunu söylemeye bile gerek yok
    Bu eğilim ortadan kalkacak gibi görünmüyor. Şimdiki kadar hızlı büyümeyebilir ama yok da olmayacak gibi. Bellek şirketlerinin kendilerini iflasa sürüklemek istememesini anlıyorum, ama bu riski model sağlayıcılarına ya da ekosistemdeki diğer oyunculara aktararak RAM kapasitesini yılda %50'ye yakın artırmanın bir yolu olmalı gibi geliyor

    • Sadece OpenAI anlaşmaları bile böyle bir büyümenin 2 yıllık kısmını emebilir
      Rekabetçi bir piyasada RAM üreticilerinin, alıcı bırakacak şekilde satış yapmaması verimsizdir
      Ekim öncesinde büyüme oranının gerçekte ne olduğunu bilmiyorum ama burada biri biliyor olabilir
    • En büyük risk, Çin tarafındaki CXML'in avantaj elde etmesi, diğer şirketlerin boş bıraktığı pazarı kapması ve ardından maliyetler normale dönmeye başlayınca rekabet ederek mevcut şirketleri geride bırakmasıdır
      %20~25 büyümenin yetersiz olduğu fikrine gelince, veri merkezi genişleme planlarının duvara çarpıp ciddi biçimde yavaşladığını ve yapay zeka heyecanının söndüğünü varsayarsak bunun tamamen uçuk bir rakam olduğunu düşünmüyorum
      Kısa vadede %20~25 yeterli olmayabilir ama bu yıl içinde yapay zeka genişlemesi durursa, arz açığı değil devasa bir arz fazlası oluşur
    • Teorik olarak çip bileşenleri için yeni bir vadeli işlem piyasası yardımcı olabilir
      Çünkü bu, DRAM tedarikçilerinin risklerini hedge etmesini sağlar
    • Yakın tarihli bir habere göre HBM, wafer alanı açısından LPDDR'den 3 kat daha verimsiz, ancak bant genişliği 3 katın da üzerinde
      Peki herkes örneğin bilgisayarları 1/3 daha az hızla satın alıp tamamen HBM'e geçse kârlı olur mu?
      Hesaplama performansı ile bellek arasındaki fark uzun zamandır açılıyor ve belki de acı verici olsa bile HBM'e geçiş tam da gereken şey olabilir
      Bellek bant genişliği düşük 3 orta sınıf bilgisayara sahip olmak mı daha iyi, yoksa istatistiksel olarak biraz daha bekleyip herkesin alan oranı gereği 1/3 hızında yeni bilgisayar alması ama çok daha yüksek bant genişliğinden yararlanması mı daha iyi?
  • Gidişata bakınca oyun ya da makine öğrenimi gibi tüketici pazarlarını nasıl kaldıracaklarını gerçekten merak ediyorum
    Bulut oyun kesinlikle gelecekte hayatımıza girecek ve benim gibi safçılar offline oyun için prim ödeyip RTX 5090 alacak gibi görünüyor

    • Uzun vadede bulut oyun kaçınılmaz
      Çünkü grafik işleme için gereken donanım maliyetini birçok tüketiciye paylaştırarak amorti etmek, kullanılmadığında boşta bırakmamak ve oyun varlıklarıyla birlikte POP'a yerleştirmek ekonomik olarak daha verimli
      Yeterli oyun hesaplaması uçta çalıştırılabilirse, bugün ekonomik olarak mümkün olmayan daha teknik açıdan gelişmiş oyunlar da mümkün hale gelir. Şu anda böyle oyunların az olmasının nedeni bence esas olarak bulut oyun pazarının ve benimsenmesinin düşük olması, buna bağlı olarak teknik bilgi birikiminin de yetersiz olması
      Tüketici donanımıyla istenen oyunu işleyebilmenin maliyeti karşılanamaz hale geldiği anda, direnenler de sonunda ikna olacak ve bu yaklaşım yerleşebilir
  • Fiyatlar en azından kısmen normale dönene kadar DDR4 sistemimden vazgeçmeyeceğim
    Eskiden aldığım DDR4 2133MHz yedek bellekten 32GB hâlâ duruyor, şu anda da 3200MHz kullanıyorum. Bu şu demek: CPU üreticisi de benden para alamıyor. 5800X bir süre daha yeterli ve yeni GPU almam için de bir neden yok. Elbette B580 kusursuz değil ama

    • Ya şu an aslında geleceğin en düşük fiyatı ise?
  • İran'ın helyum tedarikini engellemiş olması oldukça ironik
    Aynı zamanda İran, düşmanlarını sarsmak için yapay zekanın ürettiği düşük kaliteli propaganda materyallerine dayanıyor. Tarihte sonradan fark edilen ironilerden biri gibi

  • Yapay zekaya tamamen kapılmamış oyuncular ve PC meraklıları için gerçekten korkunç bir dönem

    • Bu, evde kurulan PC pazarını %100 öldürecek
      Ben oyun bilgisayarı toplamaya başladığımda en üst seviye ekran kartı 750 Yeni Zelanda dolarıydı. Şimdi sadece GPU 10.000 dolar ve RAM için de ayrıca 1.000~2.000 dolar gerekiyor
      Eskiden oyun bilgisayarı erişilebilir bir hobiydi, şimdi ise genel havacılık hobisi alternatif gibi görünmeye başladı
    • Bence tam tersi
      Kısa vadede hobi tarafının baskı altına girmesi doğru ama en ileri noktayı zorlayabilecek sermaye, Fortune 500 şirketleriyle kıyaslandığında küçük kalır. Yakında hobi kullanıcıları da bunun faydasını görür, özellikle de piyasa çökerse daha da fazla
    • Yapay zekaya tamamen kapılmış insanlar için de korkunç bir dönem
  • Hyperscaler'ların neden daha fazla dikey entegrasyona gidip kendi fabrikalarını kurmadığını merak ediyorum
    Tek bir fabrika 1 milyar dolar olsa bile, şu anda Nvidia ve diğerlerinden çip almak için yüz milyarlarca dolar harcıyorlar

    • Mutlaka dikey entegrasyon gerekmez; belki de Apple'ın iPhone için yeni teknolojileri büyütürken yaptığı gibi üretim kapasitesinin artırılmasını doğrudan finanse etmek daha iyi olabilir
      Ama hyperscaler'ların ve yapay zeka şirketlerinin bunu yapmıyor olması, bunların yapay zekanın gelecekteki talebine gerçekte ne kadar inandığı hakkında çok şey söylüyor
      Yapay zeka şirketleri inanılmaz ölçekte büyüme gerektiğini iddia ediyor ama bu büyüme için gereken sermaye riskini üstlenmek istemiyor
      Çip üreticilerinin onları yavaşlattığına dair yapay zeka cephesinden çok hüzünlü yakınma duyuyorum ama bu genişlemeyi kolayca finanse edecek para gerçekten kimde var? Çip üreticileri bu oyunu çok daha uzun süredir oynuyor. Sam Altman'ın 7 trilyon dolarlık fab gerektiğini söyleyip durduğu dönemde, yapay zeka şirketleri saçma iddialar ortaya atmaya hazır olduklarını gösterdi ve güven kaybetti
      Şu anda gereken şey, ellerinde biriken devasa nakdin çok küçük bir kısmını doğrudan fab finansmanına aktarmaları
    • Fab'ler, var olan en ileri teknolojiler arasında en karmaşık olanlardan biridir
      Günümüzün “roket bilimi” gibi bir alan ve sadece parayla çözülecek bir iş değil. Milyarlarca dolar harcayıp hiçbir sonuç alamama ihtimali çok yüksek
      Intel'in son yıllarda rekabette ne kadar zorlandığına bakmak yeterli. Onlar bu işi onlarca yıldır yapan bir şirket
    • Gerekli bilgi birikimi olsa bile bir fab'in kurulması yıllar sürer
      Bilgi birikimi yoksa mevcut üreticilerle rekabet edebilmek için daha da fazla deneme gerekir. İşe yarar çipler üretebilecek hale geldiğinizde arz açığı çoktan bitmiş olabilir
    • Fab'lerin ortalama marjı, büyük teknoloji şirketlerinin marjlarıyla karşılaştırıldığında çok düşüktür ve risk de buna göre yüksektir
      Bu şirketlerin entegre olmak isteyeceği bir iş olmayabilir
    • Tek bir fab 15~20 milyar dolar tutar ve inşası en az 5 yıl sürer
      Üstelik bu şirketlerin hiçbirinde bulunmayan uzmanlık gerektirir
  • Bir hafta önce ikinci el bir Dell sunucu aldım
    İçinde 12 çekirdekli CPU ve 32GB DDR4 ECC RAM olan tüm cihazın fiyatı, sadece 64GB DDR RAM alma fiyatına yakındı. Bu saçma durumun bir an önce bitmesini umuyorum. Yoksa acı başka pazarlara da sıçrayacak. Yakın zamanda PC kasası satışlarının %40'tan fazla düştüğünü yazan bir şey okudum

    • RAM ile ilgili birim fiyat artışları nedeniyle yoksullar zaten düşük maliyetli telefon pazarından bile dışlanıyor
      https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
    • Yapay zeka balonu patladığında PC pazarı geri döndürülemez biçimde zarar görmüş olacakmış gibi hissediyorum
      “Kurumsal” parçalar üreten üreticiler tüketici parçası pazarına geri dönmeyecek. Çünkü o noktada artık pazar diye bir şey kalmamış olacak
      Sonra da düşük kaliteli üretimlerle para kazanamayan veri merkezleri SaaS amaçlı yeniden kullanılacak. OnShape benzeri şeylerin tüm uygulamalara yayılması gibi
      Kullanıcıların çoğu, ürettikleri her şeyi bulut hizmetlerinde saklama konusunda pek umursamıyor gibi görünüyor ve bu da “pahalı” masaüstü ya da dizüstü donanımına sahip olmaya alternatif olarak kolayca pazarlanabilir
    • Başka bir bakış açısı da mümkün
      Eğer hyperscaler'lar daha fazla RAM kullanıyor ve bu RAM tüketiciye gitmiyorsa, bu tüm ağır işlerin bulutta yapılacağı anlamına gelir
      Neden hyperscaler'lar ve tüketiciler aynı anda RAM'e sahip olsun? Tüketiciler yerel modeller çalıştırmak için daha fazla RAM ister ama o zaman hyperscaler kapasitesi atıl kalır
  • Bellek üreticileri dağ gibi fikri mülkiyet haklarına sahip
    Bu yüzden biri elinde fazla fab kapasitesiyle bellek üretimine girmek istese bile devasa patent duvarlarıyla mücadele etmek zorunda kalır
    Bellek şirketlerinin çoğu, birbirlerinin patent ihlallerini karşılıklı olarak dengeleyen arka kapı anlaşmalarına sahip
    Yeni bir bellek üreticisinin lisans ücretleri altında ezilmeden nasıl ortaya çıkabileceğini pek göremiyorum