- 8 adet RTX 3090 ekran kartıyla çalışan özel bir LLM sunucusu. Toplam 192GB VRAM
- Meta'nın Llamma-3.1 405B modelini çalıştırmak düşünülerek kuruldu
Arka plan hikayesi
- Mart ayında 48GB VRAM ile LLM deneyleri yürütürken zorluk yaşandı
- Daha fazla VRAM gerektiği hissedilince yeni bir sistem kurmaya karar verildi
- CPU/platform seçimi, bellek hızının önemi ve PCIe lane ihtiyacı gibi çeşitli sorular ortaya çıktı
- Saatler süren araştırmanın ardından şu platform seçildi
- Asrock Rack ROMED8-2T anakart (7x PCIe 4.0x16 yuva, 128 PCIe lane)
- AMD Epyc Milan 7713 CPU (2.00 GHz/3.675GHz boost, 64 çekirdek/128 iş parçacığı)
- 512GB DDR4-3200 3DS RDIMM bellek
- 3 adet 1600 watt güç kaynağı
- 8x RTX 3090 GPU (4x NVLink, her çift için 112GB/s veri aktarım hızı)
Blog serisi duyurusu
- Bu sistemi toplarken karşılaşılan zorluklar
- Metal çerçeveye delik açma ve 30 amper 240 volt devre kesici ekleme işi
- CPU soket pinlerini eğmek (evde denemeyin)
- PCIe riser sorunları ve SAS cihaz adaptörleri, redriver'lar ve retimer'ların önemi
- NVLink hızı, PCIe lane bant genişliği, VRAM aktarım hızı ve Nvidia'nın yazılım seviyesinde P2P yerel PCIe bant genişliğini engellemesi
- TensorRT-LLM, vLLM ve Aphrodite Engine gibi çıkarım motorlarının benchmark'ları
- Kendi LLM eğitimleri ve ince ayar çalışmaları
Sonuç
- Teknolojinin gelişimini izlerken, 2004'te 60GB HDD sahibi olduğundaki heyecanı hatırlatıyor
- 20 yıl sonra, 192GB VRAM'in çok büyük kapasite sayıldığı günleri hatırlıyor olabiliriz
- Bu proje aracılığıyla geleceğin harika teknolojilerini üretmeye katkı sunmak isteniyor
GN⁺ özeti
- Bu yazı, yapay zeka modelleri için yüksek performanslı bir sunucu kurma sürecini ele alıyor
- Güncel GPU'lar ve yüksek performanslı CPU kullanarak bir LLM sunucusunun nasıl kurulacağını anlatıyor
- Teknolojik ilerlemenin hızı ve geleceğe dair beklentiler ifade ediliyor
- Benzer işlevlere sahip projeler arasında Nvidia'nın DGX sistemleri ve Google'ın TPU'ları bulunuyor
2 yorum
Sadece kıskanabiliyorum..
Hacker News yorumu
Birinci yorum: Kişisel veri gizliliği için kendi sunucusunu kurmuş. Platformların çıktı kalitesindeki son düşüş nedeniyle bu kuruluma para harcamış olmaktan pişman değil.
İkinci yorum: 192GB VRAM'in çok göründüğü günleri bir gün hatırlayabileceğimizi söylüyor.
Üçüncü yorum: 8 GPU kullanarak 4K monitörleri çerçevesiz mini piksel duvarına dönüştüren bir proje.
Dördüncü yorum: NVLink'in ne kadar yardımcı olduğunu merak ediyor.
Beşinci yorum: Çok havalı olduğunu, ancak 24/7 verimli şekilde kullanılmazsa maliyetinin yüksek olduğunu söylüyor.
Altıncı yorum: Tinybox ile maliyet karşılaştırmasını merak ediyor.
Yedinci yorum: Benzer bir kurulumu bodrumunda bulunduruyor.
Sekizinci yorum: Anakartta 7 PCIe yuvası varken 8 GPU'nun nasıl bağlandığını merak ediyor.
Dokuzuncu yorum: 7 adet PCIe 4.0 x16 yuvası varsa 8. kartın nasıl bağlandığını merak ediyor.
Onuncu yorum: Bu seriyi okumayı dört gözle bekliyor.