2 puan yazan GN⁺ 9 일 전 | 1 yorum | WhatsApp'ta paylaş
  • Dünya genelindeki genel amaçlı DRAM arz sıkıntısı nedeniyle, 2027 sonuna kadar talebin yalnızca %60’ının karşılanabileceği tahmin ediliyor; bazıları bunun 2030’a kadar sürebileceğini öngörüyor
  • Samsung, SK Hynix ve Micron gibi büyük üreticiler yeni fab genişletmeleri yürütüyor, ancak bunların çoğu 2027~2028’den önce faaliyete geçemeyecek
  • Talebi karşılamak için yıllık %12 üretim artışı gerekiyor, ancak fiilen planlanan artış oranı yalnızca %7,5
  • Yeni tesisler, yapay zeka veri merkezleri için HBM (yüksek bant genişlikli bellek) üretimine odaklandığından, tüketici elektroniği için genel amaçlı DRAM kıtlığını gidermede sınırlı kalıyor
  • Akıllı telefonlar, dizüstü bilgisayarlar, VR başlıkları ve oyun odaklı el konsolları gibi çeşitli tüketici elektroniği ürünlerinde fiyat artışları şimdiden başladı

Küresel bellek arz sıkıntısının durumu

  • Nikkei Asia’nın haberine göre, DRAM üretimi artırılsa da üreticilerin 2027 sonuna kadar talebin yalnızca %60’ını karşılayabileceği öngörülüyor
  • SK Group başkanı, çip ve wafer kıtlığının 2030’a kadar sürebileceğini söyledi

Büyük üreticilerin üretim artırma planları

  • Dünyanın en büyük 3 bellek üreticisi olan Samsung, SK Hynix, Micron yeni fab inşaatları yürütüyor
  • Ancak yeni tesislerin çoğu ancak 2027’de, en erken 2028’de faaliyete başlayacak
  • 2026 içinde fiilen kapasite artışı sağlayan tek örnek, SK’nin şubatta devreye aldığı Cheongju fab’ı oldu

Üretim artış oranı ile talep arasındaki fark

  • Counterpoint Research’e göre, talebi karşılamak için 2026~2027 döneminde yıllık %12 üretim artışı gerekiyor
  • Gerçekte planlanan üretim artış oranı %7,5’te kalıyor
  • Planlananla gereken arasındaki fark, arz sıkıntısını uzun süreli hale getiren temel etken

HBM önceliği ve tüketici pazarı üzerindeki etkisi

  • Yeni fab’lar, yapay zeka veri merkezlerinde kullanılan HBM (High-Bandwidth Memory) üretimine odaklanıyor
  • Üreticiler zaten HBM’yi genel amaçlı DRAM’in önünde üretiyor; bu yüzden bilgisayar ve akıllı telefon belleği arzında iyileşme sağlanıp sağlanmayacağı belirsiz
  • Bu nedenle tüketici elektroniği tarafındaki fiyat baskısının hafifleyip hafiflemeyeceği net değil

Tüketici elektroniğinde fiyat artışı örnekleri

  • RAM kıtlığı nedeniyle çeşitli ürün kategorilerinde fiyat artışları şimdiden görüldü
    • Samsung Galaxy akıllı telefon ve tabletlerinde fiyat artışı
    • Microsoft Surface fiyat artışı
    • Meta Quest 3 / 3S VR başlıklarında 100 dolarlık artış
    • AYN’nin çift ekranlı oyun el konsolunda fiyat artışı

1 yorum

 
GN⁺ 9 일 전
Hacker News görüşleri
  • Benim anladığım kadarıyla Samsung, SK Hynix ve Micron'ın talebi karşılayacak üretim kapasitesi yok ve eldeki kapasite de DRAM yerine öncelikle HBM'e ayrılıyor. HBM'in tüketici elektroniğine kolayca yönlendirilmesi de pek mümkün görünmüyor; bu yüzden önümüzdeki 3-4 yıl genel tüketici pazarı için epey zorlu geçecek gibi. Üstüne OpenAI da sermaye baskısı altında ve nakit yakma hızıyla gelirleri hakkında soru işaretleri büyürken, bu RAM paniğini tetikleyen satın alma taahhütlerini bile sonuna kadar yerine getirmeme ihtimali var; bu da sonunda bellek üreticilerinin elde stokla kalabileceğini düşündürüyor

    • Bu bana 2019'da Radeon VII'nin 700 dolarlık bir tüketici GPU'su olmasına rağmen HBM2 ile 1TB/s bant genişliği sunmasını hatırlatıyor. O dönemde AMD orta segmentte bile HBM kullanıyordu; eskiden sıradan tüketiciye de satılabilen bir teknolojinin bugün neden sanki tanrısal bir teknolojiymiş gibi pahalı ve özel anlatıldığını anlamakta zorlanıyorum
    • Bölgesel değişkenler de büyük. Hollanda'da elektrik şebekesi doygunluğu yüzünden veri merkezi kurmak isteyen şirketlere, ücretlerini ödemiş ve bağlantı garantisi almış olsalar bile 2030'dan önce şebekeye bağlanmalarının zor olduğu bildiriliyor. Bu da henüz inşa edilmemiş veri merkezleri varsayımıyla bellek kapasitesinin rezerve edildiği anlamına geliyor; dolayısıyla inşaatlar ertelenir ya da iptal edilirse arz ve talep daha da tuhaf biçimde dolaşabilir
    • Bana göre bellek üreticilerinin sonda yükü üstlenmesi senaryosu sürekli tekrarlandı. En az üç kez benzer bir tablo gördüğümü düşünüyorum
    • Yine de bu kez bellek üreticileri geçmişteki kadar agresif kapasite artışına gitmedi ve bence bu tam da stok patlamasından kaçınmak için yaptıkları bir tercihti
    • Bence Altman'ın çeşitli altyapı kurma vaatleri çöktükçe denge beklenenden daha hızlı arz fazlası tarafına kayacak. Finans dünyası da artık böyle altyapıların o kadar hızlı inşa edilemeyeceğini ve inşa edilse bile kârlı olmayabileceğini fark etmeye başlıyor gibi görünüyor
  • Benim hâlâ netleştiremediğim soru şu: Yapay zeka yazılım üretimini kolaylaştırırsa fiyatlar düşecek, ama zaten yapay zekaya yapılan harcama küresel toplam yazılım harcamasının birkaç katına çıkmışken yazılım şirketleri bu maliyeti nasıl taşıyacak bilmiyorum. Bu yüzden mevcut RAM talebi bana kum üzerine kurulmuş gibi geliyor ve sonunda büyük bir arz fazlasına dönme ihtimali yüksek görünüyor

    • Ben o kadar karamsar değilim. LLM'ler bir araç olarak zaten yeterince kullanışlı ve ortadan kaybolmayacak; asıl mesele sonuçta ölçeklenebilirlik ve maliyet düşüşü. Küçük şirketler kullanamasa bile büyük şirketler savunma, kaynak geliştirme ve finans gibi alanlarda önce pek çok kullanım alanı bulabilir. Tersine, maliyet yeterince düşerse küçük ekipler de kullanır; ama fazla ucuzlarsa potansiyel müşterilerin evde kendi yazılımlarını üretmesi gibi bir paradoks da doğabilir diye düşünüyorum
    • Analist hesaplarına göre iPhone kullanıcı başına aylık 35 dolar, Netflix abonesi başına ise aylık 180 dolarlık yeni abonelikler gerekebilir deniyor. Claude Max'in fiyatı artsa bile tüm Netflix kullanıcılarının böyle bir bedel ödeyeceği şüpheli. Bununla ilgili Tom's Hardware makalesine bakılabilir
    • Herkes adeta Jevons paradox üzerine bahis oynuyor. Yani yapay zekanın bir sonraki yarı iletken, bir sonraki internet olmasını umuyorlar
    • Ben bunu bir Truva atı gibi görüyorum. Sonunda dünyanın bu teknolojiye alışması ve ona bağımlı hâle gelmesini hedefleyen bir strateji gibi hissettiriyor
  • Bence bu durum uzun sürecek. Üreticiler pandemi sonrasında arzı kısıtlamanın kârı maksimize ettiğini öğrendi ve otomobil fiyatlarının eski kolaylıkla düşmemesine bakılırsa RAM de benzer bir yola girebilir. Apple ya da OpenAI gibi büyük müşterilerin aksine sıradan tüketiciler büyük sözleşmeler yapamıyor; bu yüzden sonunda maliyeti üstlenen tarafın biz olacağını düşünüyorum

  • Ben biraz iyimserim. Bunun RAM'i savurganca kullanan geliştiricilere bir uyarı olacağını ve uygulamaların mecburen daha bellek verimli hâle geleceğini umuyorum

    • Bu bana biraz 1973 petrol şoku sonrasında V8 motor döneminin kapanışını hatırlatıyor
    • Ancak mevcut talebi asıl çeken şey büyük ölçüde inference olduğu için, geliştiricilerin gerçekten çaresiz hissedip optimize etmeleri için güçlü bir motivasyon olmayabilir diye düşünüyorum
    • Keşke bu vesileyle Electron da güç kaybetse. Ekranda basit bir içerik göstermek için 500KB'nin yeterli olacağı bir işi 300MB'ı aşan uygulamalarla yapmak bana hiç mantıklı gelmedi
      • Bu gerçekten rüya gibi bir senaryo olurdu
    • RAM kullanımını azaltmak için çoğu zaman CPU kullanımını artırmak gerekiyor; bu yüzden RAM fiyatı artsa bile toplamda her zaman iyi bir takas olmayabiliyor
  • Makalede Google'ın TurboQuant'ından hiç bahsedilmemesi beni şaşırttı. 26 gün önce duyuruldu; KV cache belleğini 6 kat azaltıp hızı da 8 kata kadar artırdığı söyleniyor ve şimdiden llama.cpp'ye de eklendi; böylece daha büyük bağlamları, daha küçük modellere taviz vermeden çalıştırmaya yardımcı oluyor. Tabii ben de bunun RAM sorununu ciddi biçimde hafifletip hafifletmeyeceği konusunda hâlâ şüpheliyim. Talep, sağladığı tasarruftan daha hızlı büyüyebilir. İlgili bağlantı için bu HN gönderisine bakılabilir

    • Sektörde TurboQuant'ın en ileri SOTA olmadığı yönünde güçlü bir görüş de var. Bitrate bazlı KV nicemleme için daha iyi yöntemler bulunuyor; örneğin SpectralQuant gibi alternatifler var. Ayrıca 6 kat ifadesi BF16 KV cache ile karşılaştırılan bir sunum tarzı; mevcut 8 bit ya da 4 bit yöntemlerle kıyaslayınca tablo değişiyor
    • Bir düzeltme de gerekli. TurboQuant makalesi aslında Nisan 2025'te arXiv'e yüklenmişti ve mevcut uygulama yaklaşık 3,8x ile 4,9x arasında bir sıkıştırma sağlıyor; üst uç rakamlar için GSM8K performansında ciddi taviz vermek gerekiyor. Hız da taban düzeyin %80-100'ü civarında; yani iyileşme olmayabilir, hatta daha yavaş bile olabilir. Uygulama durumu için vLLM PR, tartışmalar için vLLM issue incelenebilir. Ben şahsen DMS deniyorum; daha umut verici görünüyor ve başka nicemleme yöntemleriyle birlikte de kullanılabiliyor gibi. Daha büyük kazanımlar ise Gemma 4'ün SWA global hybrid, MLA, DSA, linear layers, SSM gibi model mimarisi iyileştirmelerinden geliyor; ama bunların da sonuçta Jevons paradox yüzünden toplam bellek talebini azaltmayacağını düşünüyorum. Sadece benim kodlama araçlarım bile ayda 10-15 milyar cache token tüketiyor; ajanlar ve ana akım geliştirici kullanımı arttıkça insanların isteyeceği token sayısının fiilen bir üst sınırı olmayacak gibi
    • Yerel model tarafında işlerin düşük RAM düşük VRAM hedefiyle ilerlemesi kesinlikle yardımcı oluyor. Örneğin Gemma 4 32B piyasadaki dizüstü bilgisayarlarda bile çalışabiliyor ve bana iki yıl önceki SOTA olan gpt-4o seviyesinde, hatta ondan daha iyi bir zeka sunuyormuş gibi geliyor. Bellek fiyatları istikrara kavuştuğunda Opus 4.7 seviyesinin de yerelde çalıştırılabileceğini umuyorum. Büyük modellerin gömülü bilgisi daha fazla, ama web araması gibi araç çağrılarını ne zaman yapacaklarını doğru seçebilmeleri bile bunun önemli bir kısmını telafi edebilir diye düşünüyorum
    • Bana göre net etki, aynı işi daha az bellekle yapmak değil; aynı bellekle daha çok iş yapmak yönünde olacak. Şirketler sundukları ürünlerin bağlam penceresini daha da büyütecek ve insanlar da bunu aynen kullanacak. Bu da bana belleğin geleceğine dair biraz acı bir gerçek gibi görünüyor
    • Yine de modelin kendisini bellekte tutmanın maliyeti hâlâ yüksek. Örneğin 16GB RAM'in varsa hissedilen kazanç o kadar büyük olmayabilir
  • Makalede Çin'deki yeni bellek üreticilerinden de söz edilmemesi beni şaşırttı. Örnek olarak bu makaleyi hatırlatıyor

    • Makalenin kendisinde de belirtildiği gibi CXMT gelişmiş DRAM süreçlerinde Samsung, SK Hynix ve Micron'ın yaklaşık 3 yıl gerisinde ve 2026'nın ikinci yarısındaki hatları 2027'den önce küresel arz-talep dengesini ciddi şekilde etkileyemeyecek. Öte yandan asıl makale 2028'de talebin arzı aşacağını öngörüyor; dolayısıyla Çin üretiminin mevcut teknoloji seviyesini yakaladığı an 2029 civarı olabilir. Uzun vadede fiyatları düşürmeye yardımcı olur, ama şu anki kıtlığı önleyecek düzeyde üretim verimliliği henüz yok gibi görünüyor
  • Yakın zamanda yeni bir oyun PC'si toplamayı düşünüyordum ama fiyat şoku ve tek tek parçalardaki tedarik sorunları yüzünden bunu sürekli erteledim. Sonra yakındaki bir Microcenter'da 5090 ve üst düzey güç kaynağı da içeren neredeyse tam donanımlı bir hazır sistemi 5 bin doların altında görünce hemen satın aldım. 10 küsur yıl önce hazır sistem almak, ya gerçekten çok paran varsa ya da hafta sonundan bir günü bile ayıramıyorsan mantıklıydı; ama bugün neredeyse düşünmeden alınabilecek bir seçenek gibi geldi

    • Bence temel kural hâlâ kendin toplamanın avantajlı olduğu yönünde. Hazır sistemlere montaj maliyeti de eklendiği için yapısal olarak daha pahalı olmaları kaçınılmaz ve anakart ya da güç kaynağı gibi daha az göze çarpan bileşenlerde taviz verilmiş olması da düşük bir ihtimal değil. Tabii iyi bir fırsat yakalamış olabilirsin ama bu istisna genel kuralı değiştirmez
  • Bunun insanları daha bellek verimli yazılımlar kullanmaya yöneltip yöneltmeyeceğini merak ediyorum. Bugünlerde en ufak programlar bile yüzlerce MB RAM tüketiyor gibi geliyor

    • Ben de gerçekten vibe-coding yaparken RAM kullanımını düşürmeyi açık bir hedef olarak koyduğum zamanlar yaşadım
  • Sanırım sonunda optimizasyon çağı geliyor diye heyecanlanıyorum

    • Yine de biraz şüpheliyim. Kullandığım uygulamalar genelde ya çok güçlü lock-in etkisine sahip olduğu için optimize etmeye yönelik kurumsal bir istek taşımıyor ya da tersine bunu yapacak kaynaklardan yoksun. Bu yüzden pratikte benim yapabildiğim optimizasyon, ağır araçları bırakıp daha hafif araçlara geçmek oluyor; çok sayıda kişinin böyle seçimler yapmasıyla hafif araçların finansmanının ve geliştirme kaynaklarının artmasını umuyorum
    • Ben uzun zamandır OS geliştiricilerinin agresif optimizasyona odaklanması gerektiğini söylüyorum. Çip kıtlığı olmasa bile yarı iletken küçülmesindeki yavaşlama zaten bir süredir yaşanıyor ve yazılım optimizasyonu tüm donanımlara fayda sağlasa da doğrudan satış artırmıyor. Bu açıdan Linux daha az kısıtlı ve belki de Haiku OS gibi seçenekler yeniden ilgi görür mü diye düşünmeden edemiyorum
  • Bana göre RAM üreticileri hâlâ üretimi artırma konusunda isteksiz görünüyor. Acaba yatırımcıların görmediği uzun vadeli talep sinyallerini şirketler önceden mi görüyor diye merak ediyorum

    • Geçmişte bu işten birkaç kez ciddi darbe aldılar. DRAM sektörü uzun süre patlama ve çöküş döngüleriyle yaşadı; talep arttığında herkes yeni fab kurdu, sonra fiyatlar çakıldı, yatırımlar geri dönmedi ve şirketler battı. 80'lerde, 90'larda, 2000'lerde de böyleydi; şimdi geriye yalnızca üç üretici kaldığı için talebin doğası gereği döngüsel olduğunu herkesten iyi biliyorlar gibi geliyor
    • Yarı iletken sektörü 50 yılı aşkın süredir bir boom-and-bust sektörü. İlgili görsel de var ve ben de 30 yıllık sektör kariyerimde müşterilerin siparişlerinin ancak %30'unu karşılayabildiğimiz dönemleri de, iki yıl sonra fab kullanım oranı %50'ye düşüp zarar yazılan dönemleri de gördüm. Son teknoloji bir fab kurmak için 20 milyar dolar ve 3-4 yıl gerekiyor; eğer yapay zekanın balon olabileceğini düşünüyorsan, talep çöküşünden sonra geriye sadece parlak ama boş fabrikalar bırakacak bir karar almak fazla riskli olur
    • Gerçeği gören herkes muhtemelen benzer düşünüyor. OpenAI'ın satın alma taahhütleri aşırı gerçek dışı ve sürdürülebilir görünmüyor
    • Onların açısından zarar senaryosu o kadar da büyük olmayabilir. Yapı fiilen kartel benzeri ve RAM zaten gerekli bir ürün; bu yüzden daha az üretip fiyatla talep arasındaki dengede kendileri için en iyi risk-getiri noktasını hesaplamış olmaları muhtemel. Tüketici sevgisi ya da itibarından çok, asıl önemli olan piyasaların onlara daha fazla ihtiyaç duyması gibi görünüyor