Nvidia, Windows PC için canavar gibi bir CPU sistemi öneriyor
(twitter.com/lemire)- NVIDIA’nın Windows PC’ler için yüksek performanslı sistemi, CPU ve GPU’nun 128GB paylaşımlı bellek kullandığı ve en fazla 6.144 CUDA çekirdeği sunan bir çip yapılandırmasına sahip
- CPU, 10 performans çekirdeği ve 10 verimlilik çekirdeği içeriyor; performans çekirdekleri Cortex-X925 tabanlı ve SVE2, son AMD çiplerinden geride olsa da Apple Silicon’dan daha iyi seviyede
- Temel fark yaratan unsur, CPU ve GPU belleğini ayırmayan birleşik bellek yapısı; özel GPU belleğinden daha yavaş olsa da yerelde yapay zeka modeli çalıştırmak için gereken bant genişliği ve maliyet koşullarını hedefliyor
- Yerelde yapay zeka modeli çalıştırma talebi hâlâ niş bir uygulama olarak görülse de, öğrenci ölçeğindeki deneylerde 128GB paylaşımlı belleğin tepe GPU TFLOPs değerinden daha önemli olabileceği görüşü de var
- Karşılaştırma eksenleri arasında AMD Strix Halo, Intel Xe3P AI GPU ve son AMD işlemcilerdeki AVX-512 yer alıyor; ayrıca lehimli RAM nedeniyle sonradan yükseltmenin zor olması da bir kısıt
Sistem özellikleri ve bellek yapısı
- Nvidia’nın Windows PC’ler için önerdiği CPU sistemi, 128GB paylaşımlı bellek ve en fazla 6.144 yeni nesil CUDA çekirdeği içeren bir yapılandırma sunuyor
- CPU, 10 performans çekirdeği ve 10 verimlilik çekirdeğinden oluşuyor; performans çekirdekleri Cortex-X925 tabanlı
- Cortex-X925’in SVE2’si, teknik özellikler açısından son AMD çiplerinden geride olsa da Apple Silicon’dan daha iyi seviyede olarak karşılaştırılıyor
- Son AMD işlemcilerin tamamı AVX-512 destekliyor; AVX-512’nin Cortex-X925’in SVE2’sinden çok daha üstün, daha fazla veri işleyebilen ve daha genel amaçlı olduğu belirtiliyor
- Intel ise şimdiye kadar tüketici sistemlerinde AVX-512 sunma konusunda temkinli davrandı
- 128GB birleşik bellek, CPU ve GPU için ayrı bellekler yerine tek bir havuzun paylaşılması anlamına geliyor; bu, Apple’ın birkaç yıl önce seçtiği yolla aynı yapı
- Birleşik bellek giderek daha popüler hale geliyor; özel GPU belleği kadar hızlı olmasa da yerelde yapay zeka modeli çalıştırmak için yeterli bant genişliğini sağlayacak kadar düşük maliyetli olma avantajına sahip
- Birleşik RAM’de CPU ile GPU arasında veri taşıma gerekmiyor; her şey tek bir bellek havuzunda olduğundan bunun sıfır kopya işlemler gibi hissettirdiği görüşü var
- Intel ve AMD’nin buna nasıl yanıt vereceği izlenmesi gereken nokta
İlgili çeşitli görüşler
- Yerelde yapay zeka modeli çalıştırmaya ne kadar talep olacağı belirsiz; bu hâlâ niş bir uygulama
- Bu sistemin video oyunları için iyi bir makine olabileceği düşünülürken, oyun için değil büyük modeller için tasarlandığı ve bu yüzden beklendiği kadar iyi oyun performansı vermeyebileceği yönünde karşı görüşler de var
- Öğrenci ölçeğindeki deneylerde 128GB paylaşımlı belleğin tepe GPU TFLOPs değerinden daha önemli olabileceği ve bunun hangi model ve iş yüklerinin yerelde denenebileceğini değiştirebileceği savunuluyor
- RAM sonradan değiştirilemiyor ve tamamen lehimli; bu da bir ödünleşim
- Bellek kapasitesi ihtiyacı konusunda 128GB’nin yetersiz olduğu, 256GB veya 512GB istendiği; yapay zeka işi için “beast” bir sistemde en az 512GB gerektiği ve hatta 1TB birleşik bellek seçeneği istendiği görüşleri var
- Yazarın 128GB seçiminin nedenine verdiği kısa yanıt: "maliyet"
- İşletim sistemi tarafında “regular Windows” çalıştırmadığı iddiasıyla birlikte işletim sistemiyle ilgili hayal kırıklığı dile getiriliyor ve Linux kurulması öneriliyor
- AMD Strix Halo, 128GB birleşik bellek ve büyük bir iGPU’ya sahip benzer bir ürün; masaüstü Zen 5’in AVX-512’sini barındıran bir karşılaştırma noktası
- AMD Strix Halo’yu birkaç aydır yerel LLM homelab’inde kullanan bir deneyime göre, prosumer düzeyinde LLM çalıştırmak mümkün ama gerçek darboğaz bellek bant genişliği
- Yeni Nvidia çipinin 300GB/s üzerinde bellek bant genişliğine ihtiyaç duyduğu belirtiliyor
- RTX5090, zaten masaüstü sistemi olanlar için daha küçük modellerde daha hızlı ve daha ucuz olabilir; buna karşılık bu kart ailesi daha büyük yerel modeller için daha uygun
- Yerel yapay zeka çalıştırmanın avantajları arasında gizli ya da müşteri verilerini sorumluluğun kimde olduğu belirsiz üçüncü taraflara göndermemek, SaaS abonelikleri ve token ücretlerinden kaçınmak ve PC kullanım davranışını öğrenen yerel modellerin görev yürütmesiyle bağlantı kurulması sayılıyor
- Yerel modeller kullanıcıya görünmeyen özellikler olarak çalışabilir; daha yüksek zekâ ya da daha fazla bağlam gerektiren görevler uzaktaki sistemlere offload edilebilir
- Asıl mesele, yerel modelin kendisinden çok birleşik yapay zeka uygulamalarını destekleyen yazılım platformu ve masaüstünü ilgili tutmanın yolu olarak görülüyor
- Google Chrome’u çalıştırmanın yerel yapay zeka kullanım senaryosu olabileceğine örnek olarak Chrome’un built-in AI dokümanı veriliyor
- Intel Xe3P AI GPU karşılaştırmasında 160GB LPDDR5X, azami 480GB olasılığı, 640-bit bellek arayüzü ve PCIe x16 yapılandırması öne çıkıyor: https://tomshardware.com/pc-components/gpus/…
1 yorum
Hacker News görüşleri
Birleşik bellek havuzu, özellikle veri merkezi dışındaki sistem mimarilerinde, görünüşe göre uzun süre bir “oyun değiştirici” olmaya devam edecek
Modern oyunlar ya da tüketici işleri aslında GPU’nun PCIe bant genişliğini veya GDDR bellek bant genişliğini tamamen kullanmıyor; yerelde çalışan yapay zeka için de ortalama tüketici açısından daha hızlı belleğin getirisi çok büyük değil
Birleşik bellek, ihtiyaca göre kullanımın optimize edilmesini sağlıyor ve GDDR/DDR yerleşimini ayrı ayrı düşünme gereğini ortadan kaldırarak küçük ve taşınabilir cihazlarda toplam bellek maliyetini düşürüyor
Dezavantaj ise güvenlik; GPU ya da CPU tarafındaki bellek yan kanal saldırıları diğer tarafa da sıçrayabilir, bu yüzden ileride bellek güvenliğine yönelik tasarım daha önemli hale gelecek gibi görünüyor ve bu da Rust savunucuları için iyi bir gelişme olabilir
Oyunlarda mesele donanımı doyurmak değil, kare süresi sınırı içinde tutarlı çıktı üretmektir
5090’ı oyunla tamamen doldurmaya çalışsanız bile hedef pazar küçüktür ve kare hızını tutturmak için kullanıcıların gerçek sistemlerinin de test cihazı kadar iyi çalışması gerekir
Mevcut nesil konsollar ile mevcut nesil PC’ler arasındaki en büyük farklardan biri birleşik bellektir
İşlerin %99’unda, GPU belleğinden ziyade sistem belleğine en az bir basamak daha fazla ihtiyaç var ve çoğu sistem video ve gezinme için gerekenin üstünde neredeyse hiç GPU belleği gerektirmiyor
Yeni kullanım senaryolarının ortaya çıkması yapıyı tamamen tersine çevirmez; bugün 128GB gerekiyorsa ve yerel yapay zeka da 128GB istiyorsa, aynı işleri sürdürmek için 256GB gerekir
Aslında bu daha çok GPU’da bu kadar pahalı bellek kullanmayalım argümanına benziyor; yalnızca çıkarım yapılıyorsa bu doğru olabilir
Birleşik bellek mimarisi altında ciddi ölçüde performans fedakârlığı yapılır; bazı durumlarda mantıklıdır ama her derde deva bir çözüm değildir
İnsanların ne kadarının yerelde AI model çalıştırdığını bilmiyorum; bu hâlâ niş görünüyor, ama son Gemma sürümlerine bakınca yalnızca maliyet açısından bile bazı modelleri yerelde çalıştırma olasılığı artmış durumda
Kurumsal güvenlik hesaba katıldığında bu daha da geçerli; yine de bu mimarinin oyun için neden iyi olduğu bana pek açık gelmiyor, bu yüzden orijinal metindeki genel cümleye şüpheyle yaklaşıyorum
Ayrıca “Stanford/Elsevier 2025 dünya çapında bilim insanları ilk %2, GitHub ilk 1000 geliştirici” gibi ifadeleri her yere eklemek ters etki yaratıyor gibi hissettiriyor
Bunu çeşitli M5 MacBook’lara dağıttım ve birçok görevde gerçekten faydalı oldu
Opus ya da mevcut nesil Sonnet düzeyindeki modellerin yerini tutmuyor ama boyutuna göre şaşırtıcı derecede iyi; Sonnet 4 dönemine benzer ya da biraz daha eski bir seviyede görünüyor
Araç çağırma, kodlama ve ajan görevlerinde Gemma modellerinden çok daha istikrarlı ve özellikle MTP kullanılırken daha hızlı
Diğer hesaplama işleri gibi ölçek ekonomisinin burada neden geçerli olmadığını anlayamıyorum
Yazarın emeğini küçümsemek istemem ama bu yazı gerçekten derine inerek değil, daha çok özellik tablosuna bakılarak yazılmış gibi duruyor
5070 mobile ile çekirdek sayısı aynı ama paylaşımlı tepe bant genişliği ve paylaşımlı tepe TDP sırasıyla 2/3 düzeyinde, bu yüzden tek başına GPU performansı özel birimin yaklaşık yarısı olabilir
Apple’da SVE2 yok ama özel AMX ve SME var; SVE2’nin neden SME’den daha hızlı olacağı düşünüldüğünü anlamıyorum
Tek çekirdek tipi anılmış ama toplam yapılandırma ele alınmamış ve DGX Spark’ın Apple çipleriyle nasıl karşılaştırıldığı zaten bir yıldır biliniyor
CPU kabaca M3 Pro seviyesinde, GPU hesaplama gücü ise bant genişliği hariç M4 Pro ile M4 Max arasında; gerçek avantajı yalnızca CUDA çalıştırabilmesi
Piyasaya çıktığında Apple’ın 2-3 nesil, AMD’nin ise 1 nesil gerisinde kalması muhtemel ve DGX Spark’ın diğer bir güçlü yanı olan birbirine bağlanabilen NIC de burada yok
Spark’ta bu, M5 Max’ten çok daha hızlı; aynı model, aynı kuantizasyon, aynı sorgu ve mümkün olduğunca aynı vllm ayarlarıyla karşılaştırıldığında, büyük prompt’lar ve düşük önbelleklenebilirlik içeren işlerde MBP prefill’i bitirmeden tek bir Spark makinesi yanıtı bitirmiş oluyor
O alanda Apple avantajlı, ancak Spark’ın GPU hesaplama performansı M5 Max’in 17 FP32 TFLOPS değerinden çok daha yüksek ve kabaca 2 katı
Masaüstü 5070 gibi 6144 CUDA çekirdeğine sahip ve daha yavaş bellek ile daha düşük TDP nedeniyle yavaşlatılmış bir sürüm olduğu için, 5070’in 31 FP32 TFLOPS’una karşılık yaklaşık 29.7 civarında
Genel olarak Spark fena değil ama olağanüstü de değil
Sektörün uzun zamandır bildiği bir çipi sanki yeni öğrenmiş gibi ve rakip ürünlerden de neredeyse habersizken “BEAST”, “GAME CHANGER” diye paylaşmış izlenimi veriyor
DGX Spark da sözde oyun değiştiriciydi ama büyük ölçüde hayal kırıklığı oldu; pahalı tek bir Nvidia dizüstünün dengeleri değiştireceğini sanmıyorum
Qualcomm Snapdragon X2 Elite Extreme, tek çekirdek CPU performansında Nvidia çiplerini açık ara geride bırakıyor ve Intel ile AMD’nin en üst düzey ürünlerini de yeniyor
Birleşik belleği de var; CPU performansı ve güç verimliliği açısından Apple M serisiyle aynı ligde olan tek CPU bu
Bunu yıl sonunda değil, şu anda dizüstü bilgisayar olarak satın alabiliyorsunuz ama insanlar Qualcomm’u küçümsüyor
Linux desteği yoksa neredeyse hiçbir anlamı yok ve bu alandaki önemli iki platform Linux ve Darwin
Qualcomm, tıpkı AMD’nin onlarca yıl GPU tarafında olduğu gibi, çok duyuru yapan ve web sayfalarını okuyup heyecanlanan internet hayranları bulunan ama gerçekten çalıştırmaya kalkınca kabusa dönen bir şirket
Snapdragon X Elite Linux’ta çalışmıyor, bu yüzden platform olarak işe yaramıyor; hatta hevesli kullanıcılar M1’i daha iyi çalışır hale getirdiği için Qualcomm yerine eski bir Mac kullanmak daha mantıklı oluyor
Karşılaştırma hedefi, Mediatek Dimensity 9500’deki X930 veya C1, yani Snapdragon 8 Elite Gen 5 / X2 Elite tarafı olmalı
Qualcomm hâlâ performans üstünlüğüne sahip ama bu fark giderek kapanıyor; daha önemlisi Nvidia ekosistemi çok daha iyi kuruyor
Nvidia’nın PC oyuncu GPU’ları üzerine kurulu dağıtım kanalları ve iş ortakları çok daha güçlü, oyun geliştiricileriyle ilişkileri de sektörde unmatched
Qualcomm ise hem PC hem sunucu CPU tarafında hâlâ gerçek bir uygulama gücü gösterebilmiş değil
Geçmişte çok fazla kötü deneyim yaşandığı için insanların tereddüt etmesi kaçınılmaz; şimdi daha çok çabalıyor gibi görünüyor ama PC pazarındaki itibarını toparlaması zaman alacak
Gerçek cihazın basın bülteni burada
https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-...
Microsoft’un ve özellikle NVIDIA’nın, özünde kullandıkça ödemeli bulut yapay zeka modelleri ile çatışan cihazlar çıkardığına dikkat çeken çok az kişi olması şaşırtıcıydı
Copilot için daha iyi çevrimdışı BYOK, sınırsız AI geleceği gibi diğer duyuru ve sinyallere bakınca, iki şirket de yalnızca bulut odaklı yapay zekanın ne sürdürülebilir ne de doğası gereği kendi lehlerine olduğunu anlamış gibi görünüyor
Yine de böyle ürünlerle OpenAI’yi zayıflatmaya çalışma tavrı dikkat çekiyor
Microsoft yerel yapay zekayı güçlü biçimde itiyor
Fiyatlar gerçekten artmadıkça yerel LLM’lerin geniş çapta benimseneceğinden emin değilim
Sonnet ya da Kimi gibi daha ucuz, barındırılan küçük modelleri kullanmak mantıklı geliyor ve bu cihazlar muhtemelen Kimi seviyesinde modelleri çalıştıramayacak; oysa bu seviye, oyuncak olmayan ajan işlerinin taban çizgisi
20 dolarlık abonelikten kaçmak için 5.000 dolar harcamak, niş güvenlik gerekçeleri dışında pek mantıklı değil
Dungeon Crawler Carlı gördün mü?Bence çoğu kişi bu tür dizüstü bilgisayarların ne sunacağını tam anlamıyla kavramıyor
Yerel AI’dan önce büyük ihtimalle hibrit AI kullanacağız
Büyük modelleri yerelde çalıştırmak gerçekçi değil ama bir ajan iş akışında bazı parçaların bulutta, daha küçük işlerin ise yerelde çalıştığını düşünürseniz bu harika bir kombinasyon
Temel işler için Opus/Code/DeepSeek/Kimi gibi modellere gerek yok; Gemma4:12b/Qwen-27b gibi modeller çok daha düşük gecikmeyle yerelde iş görebilir
Uzak bir büyük modelle birlikte 5 tane yerel alan-özelleşmiş modeli birleştirebilen bir dizüstü bilgisayarı şu anda hemen kullanmak isterdim
OpenCode’da küçük bir modelin hangi işleri yerelde çalıştıracağına karar verdiğini ve belli bir görev için uygun bir yerel model mi yoksa bulut modeli mi kullanılacağını seçtiğini hayal edebiliyorum
Endişem, bu donanımın hızlı yerel model geçişini kaldıracak kadar güçlü olup olmadığı; muhtemelen değildir ama umarım yanılıyorumdur
Frontier modeller artık sadece 200.000 token ile daha iyi benchmark sonuçları veriyor ve distillation tarafında hâlâ gidilecek çok yol var
Bunun hangi açıdan “canavar” olduğunu pek anlamıyorum
300GB/s bellek bant genişliği, AMD Strix Halo’nun 256GB/s değerinden sadece biraz yüksek ve aynı 128GB RAM yapılandırmasında M5 Max 128GB’ın 614GB/s değerinin yarısına bile ulaşmıyor
İlgi duyanların çoğu muhtemelen AI meraklıları olduğu için bellek bant genişliği öne çıkarılıyor; üstelik bu bir Windows cihazı
M5’te ilk tokene kadar sürenin neredeyse yarısını alacak 256k token iş akışları burada gerçekçi biçimde çalıştırılabilir
AMD x86 cihaz olduğu için her şeyi çalıştırabiliyor, Apple tüm MacOS yığınını sürdürüyor ama Nvidia, her Jetson neslinde zar zor tek bir Ubuntu sürümünü tutturabiliyor; bu da utanç verici
Durmadan bahsettikleri ajanları keşke gerçekten işletim sistemi desteği çalışmalarına yönlendirseler
Zaten satın alınabilen ve 128GB birleşik bellek desteği sunan AMD Ryzen AI Max gibi bir şeyden farkının ne olduğunu gerçekten merak ediyorum
2026'da hâlâ kimlerin “Windows PC” ifadesine bu kadar takıldığını bilmiyorum
Bu sadece kişisel bilgisayar ve genelde birden fazla işletim sistemini gayet iyi çalıştırabiliyor
“Windows PC” ifadesi ya Microsoft'tan para almışsın ya da teknoloji hakkında Word belgesine resim koyup gönderen biri gibi konuşuyormuşsun hissi veriyor
İşletim sisteminden bağımsız bir cihazın keyfini zorla kötü bir işletim sistemine bağlamaya gerek yok
Muhtemelen diğer bütün pazarların toplamından daha fazla PC satın alma ihtimalleri var
Kişisel kullanımda da Windows ile başka bir işletim sistemini çift önyüklemeyle kullananlar çok küçük bir azınlık olacaktır
“Windows PC”, “Apple'ın yaptığı” ile “diğerlerinin yaptığı”nı ayırmak için gayet makul bir ifade ve Apple yapımı olmayıp da varsayılanı Windows olmayan PC pazarı gerçekten çok küçük
Açıkçası bu konuda bu kadar saldırgan bir tavır almak tuhaf görünüyor
PC kelimesi ya özgün anlamıyla bütün kişisel bilgisayarları ya da Mac'e karşıt olarak IBM PC türevlerini ifade edebilir, yani muğlak
“I'm a Mac, I'm a PC” reklamını düşün
Sadece PC denince bugün insanlar gerçekten hangi anlamın kastedildiğini karıştırıyor; “IBM PC” eski kaldı, “IBM PC clone” ise daha da kötü
Bu yüzden “Windows PC” oldukça iyi bir ad ve “Non-Mac PC” de kulağa pek iyi gelmiyor
Bunu ille de aşağılayıcı bir dille söylemeye gerek yok
Kurumlarda ya da oyun gibi bazı ev tipi masaüstü kullanım senaryolarında Windows'un tercih edilme sebebi hâlâ donanım·yazılım uyumluluğu
İşte Windows programları geliştirildiği için kullanılıyor ve Win-for-ARM'da hâlâ bulunmayan sürücüler de kullanılıyor
Bu yüzden çoğu kişi için “Windows PC” hâlâ x64 Windows PC anlamına geliyor
Windows-Arm64 uyumluluğu yeterince iyi değilse, zaten yeni yazılım ve donanım gerekeceği için insanların Windows'un kendisinden uzaklaşması da Microsoft açısından bir risk
Lanetli Nvidia Hackintosh çok komik olurdu gerçi
Sıradan kullanıcı için bilgisayar işletim sistemi üç şeyden ibaret: Windows, Apple ve ChromeOS; Nvidia ChromeOS'a yönelmeyecek, Apple da Nvidia'dan hoşlanmıyor, yani pazarlanabilir tek normal işletim sistemi Windows
Pazarlama, bu cihazların birçok kişinin masaüstü deneyimini mahveden ucuz Chromebook'lar olmadığını açıkça ortaya koyuyor
Qualcomm Linux desteği sözü verip bunu başaramadı; o söz yüzünden eli yananlar o donanımı tekrar almak istemeyecektir
Windows PC sözü vermek, Linux, FreeBSD, SerenityOS önyüklenmiyor diye şikâyet etme gerekçesini azaltıyor; Qualcomm'un başarısızlığına bakınca Nvidia muhtemelen doğru tercihi yapıyor gibi görünüyor