Yapay zeka RFIC tasarımının “kara büyüsünü” öğreniyor
(spectrum.ieee.org)- RFIC’ler 5G, otomotiv radarı ve uydu iletişimi gibi kablosuz teknolojilerin temelini oluşturuyor, ancak elektromanyetik, termal ve paketleme güvenilirliğini aynı anda tutturmak zorunda oldukları için elde yürütülen zor bir problem olarak kalıyor
- Princeton araştırmacıları, insan tasarım şablonlarını başlangıç noktası olarak almak yerine, pekiştirmeli öğrenme ile ters tasarımı birleştirerek mimariyi, devre topolojisini, bileşen parametrelerini ve elektromanyetik arayüzleri sıfırdan araştırıyor
- Yapay zeka tabanlı emülatör, rastgele 2 boyutlu elektromanyetik yapılara ait saçılma parametrelerini milisaniyeler içinde tahmin ederek, geleneksel elektromanyetik çözücülerin dakikalar-saatler süren tekrarlarını büyük ölçüde azaltıyor
- 2023’te 30~100GHz milimetre dalga güç yükseltecinde, o dönemdeki silikon tabanlı güç yükselteçleri arasında bant genişliği, çıkış ve verimlilik kombinasyonu açısından en iyi sonucu verdi; 2024’te ise multiport IC yapıları da dakikalar içinde üretti
- Yapay zeka çalışmayan devreler de üretebildiği için doğrulamada insan gözetimi gerekiyor; genel amaçlı bir modele ulaşmak için ise NDA’lara bağlı RFIC ve analog tasarım verilerini paylaşacak açık bir ekosistem gerekiyor
RFIC tasarımı neden “kara büyü” olarak kaldı?
- RFIC, cihazların bilgiyi kablosuz olarak alıp göndermesini sağlayan temel devredir ve otonom araçlar, kuantum iletişimi, 6G ve uydu iletişimindeki ilerleme de daha gelişmiş RF çiplere dayanır
- CPU veya GPU tasarımı standartlaşmış bir bilime daha çok yaklaşmış olsa da, RF tasarımı uzun deneyimle öğrenilen elde yapılan bir zanaat niteliğini güçlü biçimde koruyor
- RFIC tasarımı aynı anda birden fazla fizik alanını ele alır
- Maxwell denklemleri, elektromanyetik alanların aktif ve pasif bileşenlerle nasıl etkileştiğini belirler
- Termodinamik, çalışma sırasında ısının nasıl üretildiğini ve uzaklaştırıldığını belirler
- Isıl genleşme ve büzülme, çip ve paketin sıcaklık değişimlerinde kararlı kalıp kalamayacağıyla bağlantılıdır
- Tüm fiziksel kısıtlar birlikte dikkate alınmak zorunda olduğundan tasarım uzayı çok büyüktür ve bir performans metriğini iyileştirmek başka bir metriği kötüleştiren trade-off durumlarını sıkça doğurur
Geleneksel RFIC tasarım akışı ve darboğazlar
- 5G milimetre dalga telefonları için 28GHz güç yükselteci tasarlamak istendiğinde, önce devre mimarisi ve topolojisinin belirlenmesi gerekir
- RFIC mimarisi, bir evin planı gibi gerekli bileşenleri ve sinyal yollarını belirler
- Güç yükselteçlerinde yükseltme kademesi sayısı önemli bir unsurdur
- RFIC alanının büyük kısmını transistörlerden çok endüktörler, iletim hatları gibi pasif bileşenler ve elektromanyetik yapılar kaplar
- 5G sinyalleri 28GHz ve 39GHz’de, uydu iletişimi 26.5~40GHz ve üzerinde, otomotiv radarı ise 77GHz’de çalışır; RFIC’ler bu yüksek frekanslarda sinyal enerjisini hassas elektromanyetik yapılarla yönetir
- Sinyal yolu bir sonraki bileşenle düzgün eşleşmezse, enerjinin ileri akmak yerine geri yansımasına yol açan empedans eşleme sorunu ortaya çıkar
- Mühendisler, yansımayı azaltmak için bileşenler arasında çok ince geçiş yapıları tasarlar
- Bu yapı yalnızca sinyal iletimi için değil, bölme, birleştirme ve çoklu yol dağıtımı için de kullanılabilir
- Şartname karşılanamazsa topoloji ya da mimari yeniden düzeltilir ve simülasyonlar tekrarlanır; yeni bir çip tasarımı yıllar ve on milyonlarca ila yüz milyonlarca dolar gerektirebilir
Şablonların dışına çıkan yapay zeka tasarım yaklaşımı
- Önceki çalışmalar, makine öğrenmesini devre şablonlarının optimizasyonunda kullansa da hâlâ insan yapımı mevcut tasarım kütüphanelerine dayanıyordu
- Princeton araştırmacılarının hedefi, önceden hazırlanmış bir topoloji olmadan mimarinin, kurucu devrelerin ve elektromanyetik pasif yapıların tüm parametrelerini algoritmanın sıfırdan belirlemesiydi
- Bu yaklaşımın başlangıç noktası geleneksel optimizasyondan farklı
- Geleneksel yöntemler, insanın oluşturduğu bir yapıda transistör boyutu veya pasif bileşen geometrisi gibi parametreleri ayarlar
- Yeni yöntem ise neredeyse boş bir başlangıçtan aday devre kombinasyonları oluşturur, performans trade-off’larını haritalar ve tasarım uzayını araştırır
- Yaklaşım, AlphaGo Zero gibi, insan örneklerini taklit etmek yerine kendi keşif ve değerlendirmesiyle tasarım stratejisini geliştirir
- Algoritma, devreyi, elektromanyetiği ve ikisi arasındaki ortak tasarımı öğrenerek uçtan uca RFIC tasarımını hedefler
Pekiştirmeli öğrenme ile ters tasarımın birleşimi
- İlk adım, pekiştirmeli öğrenme çerçevesiyle en uygun sistem mimarisini, devre topolojisini, bileşen parametrelerini ve elektromanyetik arayüz özelliklerini belirlemektir
- Pekiştirmeli öğrenme ajanı, oyun öğrenen bir bilgisayar gibi farklı kombinasyonları dener, eylemlerle puanlar arasındaki ilişkiyi gözlemler ve daha iyi devreler bulur
- Eğitim birkaç gün ile bir hafta sürer
- Eğitim tamamlandıktan sonra devreler çok hızlı tasarlanabilir
- İkinci adım, istenen saçılma parametrelerini üreten fiziksel elektromanyetik yapıyı bulmaya yönelik ters tasarımdır
- Saçılma parametreleri, sinyal bir bileşene girdiğinde ileri mi gittiğini yoksa geri mi yansıdığını ölçer
- Bu, yapı mühendisliğinde hedeflenen alanı oluşturmak için kemer veya destek yapısı bulmaya benzer
- RFIC ters tasarımı, devre davranışı ile ara bağlantılar ve pasif bileşenlerin elektromanyetik tepkisini aynı anda eşleştirmek zorunda olduğundan, yalnızca tekrarlı manuel aramayla çözülmesi zordur
Yapay zeka emülatörünün azalttığı elektromanyetik tasarım iterasyonları
- Araştırmacılar RF devre simülatörünü yapay zeka tabanlı bir emülatör ile değiştirdi
- Bu model, rastgele 2 boyutlu yapıları girdi olarak alıp Maxwell denklemlerini doğrudan çözmeden saçılma parametrelerini tahmin eder
- Böylece geleneksel elektromanyetik çözücülerin dakikalar-saatler alan işi milisaniyelere iner
- Emülatör, görüntü işlemede güçlü olan evrişimli sinir ağları temelinde kuruldu
- Yapı görüntüleri, elektromanyetik performansı tahmin etmeye yarayan uzamsal bilgi içerir
- Araştırmacılar modeli, saçılma parametreleriyle etiketlenmiş çok sayıda rastgele pikselli yapıyla eğitti
- Pekiştirmeli öğrenme tabanlı ters tasarım ile yapay zeka emülatörünü birleştirerek uçtan uca AI designer oluşturdular ve bunu güç yükselteci tasarımına uyguladılar
İnsandan farklı RF mimarisi sonuçları
- 2023’te yayımlanan kavram kanıtı, 30~100GHz milimetre dalga bandı güç yükseltecini hedefledi
- Bu aralık, ilgili 5G ve radar frekanslarının çoğunu kapsıyor
- Nihai tasarım, o dönemdeki silikon tabanlı güç yükselteçleri arasında wide bandwidth, output power ve efficiency kombinasyonunda en iyi sonucu verdi ve record efficiency’yi korudu
- Üretilen elektromanyetik yollar, insanların genelde düşündüğü düzenli ve simetrik yapılardan farklı olarak, rastgele desenler ya da QR kodları gibi görünüyordu
- Bu sonuç, tarihsel olarak kullanılan şablonların modern tasarım hedefleri için optimale yakın olduğunun garanti olmadığını gösteriyor
- Daha sonra araştırmacılar modeli çok sayıda giriş-çıkış portuna sahip yapılara genişletti
- 2 portta 4 saçılma parametresi varken 4 portta bu sayı 16’ya çıkar ve karmaşıklık hızla artar
- 2024 tarihli multiport integrated circuits çalışması, yapay zeka algoritmasının multiport yapıları da ele alabileceğini gösterdi
- Daha önce multiport elektromanyetik simülasyonları günler ya da haftalar gerektirirken, bu model yeni yapıları dakikalar içinde evrimleştiriyor
- Pekiştirmeli öğrenme çerçevesi ile ters tasarımı birleştirerek, şartnameden fabrication-ready layout aşamasına kadar üretim yapan bir akış gösterildi; bu akış düşük gürültülü yükselteçlere, subterahertz ve broadband power amplifiers alanlarına uygulandı
Yorumlanabilir yapay zeka tasarımı
- RFIC test ve hata ayıklama süreçleri, tasarım kadar uzun sürebilir ya da daha zor olabilir; bu yüzden mühendisler sorun çıktığında anlayıp düzeltebilecekleri yorumlanabilir yapıları tercih eder
- Araştırmacılar, görüntü üreten yapay zekada kullanılan diffusion models yaklaşımını RFIC yapı üretimine uyguladı
- Metin istemi yerine saçılma parametreleri girdi olarak kullanıldı ve çıktı olarak RFIC’nin elektromanyetik yapısı üretildi
- Uzamsal frekans kadranı girdiye eklenerek tasarımcının ortaya çıkan yapının biçimini kontrol etmesi sağlandı
- Düşük uzamsal frekans: klasik ve yorumlanabilir biçimler
- Orta uzamsal frekans: labirent benzeri yapılar
- Yüksek uzamsal frekans: pikselli ya da rastgele biçimlere yakın yapılar
- İstemden çıktıya tüm süreç yaklaşık 6 dakika sürüyor ve Maxwell denklemleri altında fiziksel olarak gerçekleştirilebilir saçılma parametreleri söz konusuysa buna karşılık gelen yapı üretilebiliyor
Kalan sınırlamalar ve veri sorunu
- Yapay zeka tabanlı tasarım yaklaşımı RF topluluğunun ilgisini çekti ve geleneksel bottom-up tasarım akışını tersine çevirmeye başladı
- Hâlâ yanıt bekleyen sorular var
- Yöntem ne kadar genellenebilir?
- Sürekli olarak yüksek performans verebilir mi?
- Olası tüm trade-off’ları bütüncül olarak optimize edebilir mi?
- RFIC’nin ötesinde, insanların daha önce tasarlamadığı başka devreleri de icat edebilir mi?
- Yapay zeka, çalışmayan kötü devreler üreten hallucination sorunları yaşayabildiğinden, doğrulama için insan gözetimi hâlâ gereklidir
- Genel amaçlı bir foundational model oluşturmak için, elektromanyetik ve devre davranışını belirleyen yasaları öğrenebileceği büyük ölçekli veri gerekir
- ImageNet’in 14 milyon çeşitli ve insan etiketli görüntüyle görüntü tanıma modellerinin genellemesini mümkün kılması buna örnektir
- RFIC ve analog tasarımda da benzer ölçek ve çeşitlilikte veriye ihtiyaç vardır
- Bu veriler dünya çapındaki şirketler ve laboratuvarlardaki simülasyonlarda büyük ölçüde mevcut olsa da çoğu NDA arkasında kilitli durumdadır
- Natcast, U.S. CHIPS and Science Act’s R&D program kapsamında yeni nesil kablosuz, algılama ve savunma teknolojileri için ortak altyapıyı ve inovasyonu güçlendirebilirdi, ancak kurum ve makine öğrenmesi ile RFIC’ye ilişkin programlar sona erdi
- RFIC alanı, yapay zeka araştırmacıları ile çip tasarımcıları arasındaki işbirliğini genişletip açık bir ekosistem kurabilirse, yapay zeka tabanlı IC tasarımının potansiyelinden çok daha fazla yararlanabilir
1 yorum
Hacker News yorumları
Eski genetik algoritma aramalarını hatırlatıyor. Tahmin edip doğrulama yöntemi oldukça güçlü olabilir; özellikle araya bir aracının rehberliğini koyabiliyorsanız daha da öyle.
https://en.wikipedia.org/wiki/Evolved_antenna
Başlangıç noktası olarak: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
Gerçek bir teorinin bir yerlerde güzel ve zarif olması gerektiğine dair yaygın beklentinin önümüzdeki yüzyıla dayanıp dayanamayacağını merak ediyorum. Ya gerçek doğa olayları aslında en iyi, yalnızca makinelerin ele alıp akıl yürütebildiği korkunç derecede dağınık denklem yığınlarıyla açıklanıyorsa? Bu oldukça üzücü olurdu.
Fizikçilerin “kusursuz küresel inek” varsaydığına dair şaka da bu bağlamda; aslında “matematiğin akıl almaz etkinliği” makalesinin özü de buna yakındır. Matematiksel yaklaşımların dünyayı bu kadar iyi açıklaması başlı başına akıl almaz derecede şaşırtıcıdır.
Occam'ın usturası yararlı bir sezgisel kural, ama bizi daha basit açıklamalara doğru yanlı da kılabiliyor.
Yapay zeka tasarımının harika kullanım alanlarından biri patent kirletme. Yapay zekayla çok sayıda varyasyon tasarım üretip bir web sitesinde yayımlarsınız; daha sonra bir patent çıkarsa, çakışan kısımları kullanarak onu geçersiz kılabilir ya da en azından kapsamını daraltabilirsiniz. Çünkü patentte genelleme, önceki teknik tarafından sınırlanır.
Daha sonra yerel bir TEDx etkinliğinde mantığını açıklayarak bir miktar ilgi gördü [1]; hukuk yorumcularının ise, hâkimlerin günlük olarak bundan çok daha ince farkları ayırt ettiğini söyleyip pek etkilenmediklerini hatırlıyorum. Yine de sevimli bir denemeydi.
[0] https://allthemusic.info/
[1] https://m.youtube.com/watch?v=sJtm0MoOgiU ve
https://www.the-independent.com/tech/music-copyright-algorit...
Biraz sinir bozucu. Yapay zeka birçok şey yapabilir, ama LLM'ler ile Monte Carlo'yu, genetik algoritmaları, uzman sistemleri ve diğer istatistiksel sihirbazlıkları kapsayan geleneksel makine öğrenmesini sürekli birbirine karıştırarak, zaten yerleşmiş ve ahlaken nötr makine öğrenmesi faaliyetleriyle LLM ve Stable Diffusion'a yönelik kaygıları gereğinden agresif biçimde aynı sepete koyuyorlar.
Ve belki de amaç tam olarak budur diye de düşünüyorum.
Bir şeyde büyük ilerleme olduğunu söylemek istediğinizde, bunu bilimkurgunun insan başarılarını öngördüğüne dair popüler bilim anlayışına bağlamak az çabayla yüksek etki sağlayan bir yöntemdir. Birinci öncelik insanları heyecanlandırmaksa, amaç doğru aktarmak değildir.
“İnsanların hayal bile edemediği” sözü abartı gibi görünüyor. Yine de makine öğrenmesi algoritmalarının kaba kuvvet aramayla kimsenin denemediği çip tasarımlarına ulaşabilmesi ve bunların bir kısmının bizim için işe yarar olabilmesi gayet mümkün görünüyor. Bilgisayarın yapması için oldukça makul bir iş
Makaleden çıkarılabilecek bir şey, bu tür ilerlemeyi yaratmak için doğrulanmış çip tasarımının temel yapı taşlarını atmak zorunda kalınmış olması. Aynı şeyin sıradan kodlama için de geçerli olup olmadığını merak ediyorum. AI kodlamadaki şaşırtıcı yenilikler aslında Rust ve Python tarafından mı engelleniyor? AI araçlarını mümkün olan en düşük seviyede doğrudan kodlamaya mı bırakmalıyız?
Bu eski yazı aklıma geldi: https://www.damninteresting.com/on-the-origin-of-circuits/
İnternette bulduğum küçük hazinelerden biri
Yakındaki başka bir yorumda laboratuvarda yetiştirilmiş tasarımların sağlamlığından söz edilmişti; Damn Interesting yazısında benim için en ilginç kısım da evrimleşen programın, eğitimde kullanılan tek bir fiziksel FPGA’dan ayrılamıyor oluşuydu. Bu RFIC öğrenme modeli simülatör kullandığına göre, simülatörün çalıştığı fiziksel donanımın özelliklerinin eğitimden yeterince yalıtılıp yalıtılmadığını; farklı donanımlarda simülatörü çalıştırınca tasarımların benzer davranıp davranmayacağını merak ediyorum
Daha bariz soru ise simülatörde evrimleşen bir tasarımın gerçek fiziksel donanımda beklendiği gibi çalışması için bir umut olup olmadığı. Buna dair içgüdüm hayır diyor; yine de ilginç bir araştırma gibi görünüyor ve FPGA’da gerçekte ne olup bittiğini doğru anlamanın, pekiştirmeli öğrenmeyi gerçekten ele almanın ön koşulu olabileceğini sık sık düşünüyorum
Bu yazıyı paylaştığını görmek güzel; bu alanla ilgili başka favorilerin varsa göndermen hoş olur
En büyük soru, bu tasarımların ne kadar sağlam olduğu
Makalede gerçek cihaz ölçümlerinin tahminlerle iyi uyuştuğu gösteriliyor, ama metinde bunu açıkça ele alan bir bölüm bulamadım. Ayrıca sunulan bazı sistemlerde geleneksel olarak tasarlanmış alt bloklar var; o taraf işin bir kısmını üstleniyor olabilir
Belki de işime göz diktiğini düşündüğüm için gereksiz yere ters bakıyorumdur, belki de bizim böyle düşünmemizi istiyorlardır
Asıl kazananın, üretim ve çevresel değişkenliklere ve model sınırlarına dayanabilen basit fikirler olduğunu düşünüyorum. Geri besleme ya da simetri gibi şeyler. Oysa burada gösterilenler bunun neredeyse tersi. Devre parametrelerini birkaç kez körlemesine optimize ettim; sonunda “burada simetri gerekiyormuş” ya da “burada daha fazla bant genişliği gerekiyormuş” gibi kaçırdığım basit bir fikri fark edince her şey tamamen anlamlı hale gelmişti. Bu yüzden bu yapının birkaç pikseliyle oynayınca daha basit bir şeyin ortaya çıkıp çıkmayacağını merak ediyorum
Bir de mecburen “evrimleşmiş anten”den söz etmek gerek
Metne göre AI’ın rolü, optimizasyon sürecinde yapının davranışını tahmin etmek için elektromanyetik simülatörün yerini almak ve bunun simülasyondan birkaç büyüklük mertebesi daha hızlı olduğu söyleniyor
Kulağa makul geliyor, ama buna inanmak için AI’ın eğitiminde kullanılanlardan belirgin biçimde farklı geometrilerde AI tahminiyle gerçek ölçüm arasındaki farkı görmek isterim. Ayrıca AI modelinin hızı tam olarak hangi simülatörle karşılaştırılmış, onu da görmek gerekir
Elektromanyetik alanlar ve elektronik devreler için doğrulukla hızı takas eden çeşitli simülasyon yaklaşımları var. Bu yüzden AI çıkarımının, daha hızlı ve düşük doğruluklu bir simülasyondan mutlaka çok daha az zaman harcadığından emin değilim. Böyle bir simülasyon da AI tahmininden daha doğru ve güvenilir olabilir
Zaten önce sen söylemişsin; “oldukça basit bir fikri fark etmek” meselesiyle ilgili bir şey ekleyeyim: bence bu tür bilgisayar destekli tasarımın büyük avantajlarından biri “innovization”[1]. Biraz garip bir terim ama mesele şu: bu sistemler belirli bir sürece dair daha derin bir anlayışa götürebiliyor. Bunu gerçekten yaşayınca epey eğlenceli bir his
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
Bu makalede anlatılan yöntemler yeni değil. Bilim insanları onlarca yıldır genetik algoritmalarla, kimsenin anlamadığı ama iyi çalışan antenler tasarlıyordu
O kadar sihirli bir şey değil. Makalede de söylendiği gibi RFIC tasarımı, genel RF mühendisliğinin çok ötesine geçip tasarımcının bilgi ve deneyimine büyük ölçüde dayanan kara büyüye daha yakın; birkaç on yıl önce süper bilgisayar düzeyinde sayılacak modelleme ve tasarım araçlarından da yardım alıyor
AI’ın yapabileceği şey, olası tüm sonuçları genişlik öncelikli biçimde arayıp en iyi performans göstereni seçmek. İnsanın “bu yol iyi görünüyor, biraz daha kazalım” deme biçiminden farklı