7 puan yazan GN⁺ 2024-09-29 | 1 yorum | WhatsApp'ta paylaş
  • 2020'de çip yerleşimi tasarlamak için yeni bir pekiştirmeli öğrenme yöntemi tanıtan bir preprint yayımlandı
  • Bu yöntem daha sonra Nature'da yayımlandı ve açık kaynak olarak sunuldu
  • Bugün, bu yöntemi ve çip tasarımı alanı üzerindeki etkisini ayrıntılı olarak açıklayan bir Nature ek yazısı yayımlıyoruz
  • Ayrıca önceden eğitilmiş checkpoint'leri yayımlıyor, model ağırlıklarını paylaşıyor ve AlphaChip adını duyuruyoruz
  • Bilgisayar çipleri, yapay zekadaki etkileyici ilerlemeleri mümkün kıldı ve AlphaChip, çip tasarımını hızlandırmak ve optimize etmek için yapay zekadan yararlanıyor
  • Bu yöntem, Google'ın özel yapay zeka hızlandırıcısı Tensor Processing Unit (TPU)'nun son üç neslinde insanüstü çip yerleşimleri tasarlamak için kullanıldı
  • AlphaChip, gerçek mühendislik problemlerini çözmekte kullanılan ilk pekiştirmeli öğrenme yaklaşımlarından biri
  • Haftalar ya da aylar süren insan emeği yerine, saatler içinde insanüstü ya da benzer düzeyde çip yerleşimleri üretiyor; bu yerleşimler dünya çapında veri merkezlerinden cep telefonlarına kadar çeşitli çiplerde kullanılıyor

AlphaChip nasıl çalışır

  • Çip yerleşimi tasarlamak basit bir iş değil
  • Bilgisayar çipleri, birbirine bağlı çok sayıda bloktan oluşur ve bunlar hem devre bileşenleri hiyerarşisiyle hem de çok ince kablolarla birbirine bağlanır
  • Aynı anda karşılanması gereken karmaşık ve iç içe geçmiş çok sayıda tasarım kısıtı da vardır
  • Bu karmaşıklık nedeniyle, çip tasarımcıları 60 yıldan uzun süredir çip floorplanning sürecini otomatikleştirmekte zorlanıyor
  • AlphaGo ve AlphaZero'ya benzer şekilde, AlphaChip'i çip floorplanning'e bir tür oyun olarak yaklaşacak şekilde geliştirdik
  • Boş bir ızgaradan başlayarak AlphaChip, her seferinde bir devre bileşeni yerleştirir ve tüm bileşenler yerleştirilene kadar bunu tekrarlar
  • Ardından nihai yerleşimin kalitesine göre ödül alır
  • Yeni bir "edge-based" graph neural network sayesinde AlphaChip, birbirine bağlı çip bileşenleri arasındaki ilişkileri öğrenebilir ve bunları çip genelinde genelleyebilir; böylece tasarladığı her yerleşimle kendini geliştirebilir

Yapay zeka kullanarak Google'ın yapay zeka hızlandırıcı çiplerini tasarlamak

  • AlphaChip, 2020'de duyurulmasından bu yana Google'ın tüm TPU nesillerinde kullanılan insanüstü çip yerleşimleri üretiyor
  • Bu çipler, Google'ın Transformer mimarisine dayanan büyük ölçekli yapay zeka modellerini mümkün kılıyor
  • TPU, Gemini gibi büyük dil modellerinden Imagen ve Veo gibi görüntü ve video üreticilerine kadar güçlü üretken yapay zeka sistemlerinin merkezinde yer alıyor
  • Bu yapay zeka hızlandırıcıları, Google'ın yapay zeka hizmetlerinin de temelini oluşturuyor ve Google Cloud üzerinden dış kullanıcılara sunuluyor
  • TPU yerleşimlerini tasarlamak için AlphaChip önce çip içi ve çipler arası ağ blokları, bellek denetleyicileri ve veri aktarım tamponları gibi önceki nesillerden çeşitli çip blokları üzerinde pratik yapıyor; buna ön eğitim deniyor
  • Ardından yüksek kaliteli yerleşimler üretmek için mevcut TPU blokları üzerinde AlphaChip çalıştırılıyor
  • Önceki yaklaşımların aksine AlphaChip, insan uzmanlara benzer şekilde, daha fazla çip yerleştirme görevi örneğini çözdükçe daha iyi ve daha hızlı hale geliyor
  • AlphaChip, en yeni Trillium (6. nesil) dahil her yeni TPU nesli için daha iyi çip yerleşimleri tasarladı ve genel floorplan'in daha büyük bölümünü sağlayarak tasarım döngüsünü hızlandırdı ve daha yüksek performanslı çipler üretilmesini sağladı

AlphaChip'in geniş etkisi

  • AlphaChip'in etkisi, Alphabet, araştırma topluluğu ve çip tasarımı endüstrisi genelindeki uygulamalarda görülebilir
  • TPU gibi özel yapay zeka hızlandırıcılarının tasarımının ötesinde AlphaChip, Alphabet genelindeki diğer çipler için de yerleşimler üretiyor; buna Google'ın ilk Arm tabanlı genel amaçlı veri merkezi CPU'su olan Axion işlemcisi de dahil
  • Dış kuruluşlar da AlphaChip'i benimsiyor ve onun üzerine inşa ediyor; örneğin dünyanın önde gelen çip tasarım şirketlerinden MediaTek, Samsung telefonlarında kullanılan Dimensity Flagship 5G gibi en gelişmiş çiplerin geliştirilmesini hızlandırırken güç, performans ve çip alanını iyileştirmek için AlphaChip'i genişletti
  • AlphaChip, çip tasarımı için yapay zeka çalışmalarında patlama başlattı ve bu yaklaşım mantık sentezi ve makro seçimi gibi çip tasarımının diğer önemli aşamalarına da yayıldı

Geleceğin çiplerini üretmek

  • AlphaChip'in bilgisayar mimarisinden üretime kadar çip tasarım döngüsünün tüm aşamalarını optimize etme potansiyeline sahip olduğuna inanıyoruz
  • Akıllı telefonlar, tıbbi cihazlar ve tarım sensörleri gibi günlük cihazlarda bulunan özel donanımların çip tasarımını dönüştürebilir
  • AlphaChip'in gelecekteki sürümleri şu anda geliştiriliyor ve bu alanda yeniliği sürdürmek, ayrıca çiplerin daha hızlı, daha ucuz ve daha enerji verimli olduğu bir gelecek yaratmak için toplulukla iş birliği yapmayı umuyoruz

GN⁺ görüşü

  • AlphaChip'in yapay zeka tabanlı yaklaşımı, çip tasarımı alanında devrim yaratıyor. Özellikle çip yerleşimi tasarım sürecini otomatikleştirmede büyük ilerleme sağladı
  • AlphaChip, gerçek mühendislik problemlerine pekiştirmeli öğrenmenin uygulandığı ilk örneklerden biri ve bu da yapay zekanın gerçek dünyada nasıl kullanılabileceğini gösteren iyi bir örnek
  • AlphaChip'in TPU tasarımı üzerindeki etkisi, yapay zeka hızlandırıcı donanımının gelişiminde önemli bir kilometre taşı olacak. Daha iyi yapay zeka hızlandırıcıları, daha güçlü yapay zeka modellerini mümkün kılacak; bu da yapay zeka ilerlemesini daha da hızlandıracak
  • Ancak yapay zeka tasarım araçlarına aşırı bağımlılık, insan tasarımcıların uzmanlığının kaybolmasına yol açabilir. Uzun vadede en arzu edilen yaklaşım, yapay zeka ile insan uzmanların iş birliği olacaktır
  • Benzer yapay zeka tabanlı tasarım araçları arasında Cadence'in Cerebus'u ve Synopsys'in DSO.ai'ı bulunuyor. Önümüzdeki dönemde yapay zeka tabanlı tasarım otomasyonu araçları arasındaki rekabetin sertleşmesi bekleniyor

1 yorum

 
GN⁺ 2024-09-29
Hacker News görüşleri
  • Google'ın Nature makalesi, EDA CAD alanındaki araştırmacılar tarafından eleştirildi
    • Google içindeki araştırmacıların yanıt makalesi: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
    • UCSD araştırma ekibinin 2023 ISPD makalesi: "Assessment of Reinforcement Learning for Macro Placement"
    • Igor Markov'un eleştirel makalesi: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
  • Google'ın RL makro yerleştirme algoritması, diğer güncel algoritmalarla adil biçimde karşılaştırılmadı
    • İnsanlardan daha iyi makro yerleştirme performansı sunduğu iddia ediliyor, ancak bu mevcut hibrit yerleştirme algoritmalarının performansına ulaşmıyor
    • RL tekniği, diğer algoritmalara göre daha fazla hesaplama kaynağı gerektiriyor ve yerleştirme probleminin kendisine ait yeni bir gösterimi öğrenmek yerine bir vekil fonksiyon öğreniyor
  • Google'ın çalışmasına şüpheyle yaklaşılıyor ve bu konuda kişisel bir web sitesinde ayrıntılı bir yazı kaleme alınmış
  • Google araştırmacılarının tacize uğrayıp Anthropic'e geçtiği bir örnek var
    • İlgili makale: "Google Brain AI Researcher Fired Tension"
  • TSMC, en yeni çip tasarım otomasyon yazılımının TDP için mantık tasarımı seçebilme yeteneğini öne çıkarıyor
    • Bu, Dennard scaling'i sürdürmenin bir yolu olabilir
    • Işık hızı ve fiziksel yakınlık hâlâ önemli, ancak termal throttling'den kaçınmanın ne kadar avantaj sağlayacağı merak ediliyor
  • Çip tasarım kalitesinin nasıl ölçüldüğüne dair sorular var
    • Google'ın raporladığı metriklerin geçerli olup olmadığı ya da sadece kendilerini iyi göstermek için seçilip seçilmediği merak ediliyor
    • Çip tasarımındaki "kalite" çok boyutludur ve kullanım senaryosuna büyük ölçüde bağlıdır
    • Veri merkezi çipleri ile cep telefonu kamerası veya otomobil için tasarlanan çipler çok farklı görünecektir
    • Bu özel problem/görev bağlamında "daha iyi"nin ne anlama geldiği sorgulanıyor
  • Eurisco bir zamanlar yerleştirme ve yönlendirme görevleri için kullanılıyordu ve bunu oldukça iyi yapıyordu
    • Eurisco, Traveler TCS oyunundaki savaş uzay gemisi filolarını tasarlamak için kullanıldı
    • Eurisco, VLSI tasarımında öğrendiği simetri tabanlı yerleştirmeyi kullandı
    • AlphaChip'in sezgisel yöntemlerinin başka alanlarda da kullanılıp kullanılamayacağı merak ediliyor
  • Google'ın çip tasarım çalışması "tartışmalı" olarak görülüyor
    • Neden yeni bir şey yapmadan sadece PR yapıldığı sorgulanıyor
  • Birçok DeepX makalesinin uygun CS forumları yerine Nature'a gönderilmesi sorunu
    • Çip tasarımında daha iyi bir çalışma yapılıyorsa, IPSD veya ISCA gibi yerlere gönderilmesi gerektiği söyleniyor
    • Nature'ın bu tür makaleleri nasıl ele aldığı bilinmiyor
  • Sürekli "insanüstü" ifadesinin kullanılmasının nedeni sorgulanıyor
    • Bu tür görevlerde algoritmalar kullanılıyor; insanlar trilyonlarca transistörü elle yerleştirmiyor
  • PCB tasarımı/yerleşimi için böyle araçların olması isteniyor
  • Bellek tabanlı hesaplamanın araştırmadan rekabetçi ürünlere dönüşmesine ne kadar kaldığı merak ediliyor
    • Memristor gibi deneyleri büyük ölçekte genişletmek için çok agresif yatırım yapılacak noktaya gelindiği düşünülüyor
    • Yapay zeka veri merkezleri için kaç yeni reaktöre ihtiyaç duyulacağının tartışıldığı belirtiliyor