- Geri sarımlı (reversible) hesaplama, işlemleri ters yönde çalıştırarak veri silmeden enerjiden tasarruf etmeyi sağlayan teorik bir yöntem olarak, yapay zekanın enerji tüketimi sorununa çözüm adayı olarak öne çıkıyor
- Mevcut bilgisayarlar bilgi silindiğinde kaçınılmaz olarak ısı (enerji) açığa çıkarır ve bu durum fiziksel bir sınır olan Landauer ilkesi nedeniyle önlenemez
- Uncomputation kavramı, yalnızca işlem sonucunu bırakıp geri kalanını işlemi tersine çevirerek bilgi kaybı olmadan işler; ancak hız ve bellek maliyeti gibi pratik sınırlara sahiptir
- Son dönemde yapay zekâ gibi paralel işlemin yoğun olduğu işlerde, birçok reversible çipin daha yavaş çalıştırılmasının büyük enerji tasarrufu sağladığı deneysel olarak gösterildi
- Sanayi ve araştırma dünyası, gerçek ticari reversible çipler geliştirmeye yönelirken, yapay zekada enerji verimliliği devriminin gerçeğe dönüşme ihtimali artıyor
Bilgisayar işlemlerindeki temel enerji kaybı
- Bilgisayar iki sayıyı topladığında, örneğin 2 + 2 = 4 işleminde olduğu gibi, iki girdiden geriye yalnızca tek bir çıktı kalır
- Bu şekilde bilginin bir kısmı kaybolur ve işlem geri döndürülemez hale gelir; silinen bilgi de ısı enerjisine dönüşür
- Çoğu bilgisayar bu şekilde çalıştığı için, temelde her zaman belirli ölçüde bilgi kaybı (ısı üretimi) kaçınılmazdır
Landauer’in geri döndürülebilir hesaplama önerisi ve sınırları
- Landauer, bilgi silmeden tüm işlem sonuçlarını kaydederek enerji kaybını azaltan bir hesaplama biçimi tasarladı
- Ancak böyle bir bilgisayarda bellek kısa sürede dolacağı için, bunun pratik kullanım açısından sorunlu olduğu görüldü
- Sonunda Landauer, geri döndürülebilir hesaplamanın çıkmaz bir yol olduğu sonucuna vardı
Bennett’in uncomputation (ters hesaplama) fikri
- IBM’den Charles Bennett, 1973’te yalnızca işlem sonucunu saklayıp geri kalanını hesaplamayı ters yönde çalıştırarak (uncomputation) silme yöntemini önerdi
- Hansel ile Gretel’in ekmek kırıntılarını geri toplaması benzetmesinde olduğu gibi, yalnızca gerekli veriyi bırakıp bilgiyi kaybetmeden geri kalanını kaldırmak mümkün olur
- Bu yaklaşımın işlem süresini iki katına çıkarması ise onu verimsiz gösterdi
Pratikliği artıran araştırmaların ortaya çıkışı
- Bennett, 1989’da biraz daha fazla bellek kullanılarak işlem süresinin büyük ölçüde azaltılabileceğini gösterdi
- Sonrasında araştırmacılar bellek-zaman optimizasyonu üzerine çalışmayı sürdürdü
- Ancak bilgisayarlar yalnızca veri silme nedeniyle değil, transistörlerin bağlanma biçimindeki verimsizlik yüzünden de enerji kaybeder
- Gerçek anlamda enerji tasarruflu geri döndürülebilir bilgisayarlar üretmek için, tasarım aşamasından itibaren düşük ısı kayıplı bir yapı gerekir
MIT’nin prototip çipi ve sanayinin tepkisi
- 1990’larda MIT mühendisleri, devre verimliliğini artıran bir prototip çip geliştirdi
- Frank bu çalışmaya doktora öğrencisiyken katıldı ve daha sonra reversible computing alanının önde gelen isimlerinden biri oldu
- Ancak mevcut çip performansının hızla arttığı sanayi ortamında, bu teorik alternatife sanayinin ilgisinin düşük kalması nedeniyle destek sınırlıydı
- Frank de bir süre araştırmaya ara verip başka alanlara yöneldi
- Buna karşın devre minyatürleşmesinin sınırlarına yaklaşılmasıyla enerji verimliliği sorununa ilgi hızla arttı
Geri döndürülebilir hesaplamanın enerji verimliliği ve yapay zekâya uygulanabilirliği
- 2022’de Cambridge’den Hannah Earley, geri döndürülebilir bilgisayarların enerji verimliliğini ayrıntılı biçimde analiz etti
- Geri döndürülebilir bilgisayarlar, geleneksel sistemlere kıyasla daha az ısı yayar, ancak tamamen ısısız çalışmaları mümkün değildir
- Özellikle, hızları düştükçe ısı yayımının da azaldığı gösterildi
- Yapay zeka işlemleri paralel işleme dayandığı için, her bir çip daha yavaş çalıştırılıp çip sayısı artırıldığında toplam enerji tüketiminin azalması beklenebilir
- Düşük hız sayesinde soğutma maliyetleri de azalabilir; bu da çiplerin daha sık yerleştirilmesi, alan ve malzemeden tasarruf gibi ek faydalar sağlayabilir
Ticarileşme hareketi ve görünüm
- Yatırımcıların ilgisi artmaya başlarken, Earley ve Frank Vaire Computing’i kurarak ticari reversible çipler geliştirmeye başladı
- Kopenhag Üniversitesi’nden Mogensen ve diğerleri de reversible işlemcilerin gerçek iş ortamlarında kullanılmasına dair büyük beklenti taşıdıklarını belirtiyor
- On yıllar boyunca teoride kalan geri döndürülebilir hesaplamanın, yapay zeka ve enerji verimliliği alanlarında somut bir yenilik getirip getirmeyeceği yakından izleniyor
Sonuç
- Reversible computing, bilgi silindiğinde ısı oluşması şeklindeki bilgisayar fiziği sınırını aşabilecek pratik bir yöntem olarak, yapay zeka çağında büyük ölçekli enerji tasarrufu teknolojisi adayı olarak dikkat çekiyor
- Çipleri yavaş ama paralel çalıştırma yaklaşımı, yapay zeka işlemlerinin yapısal özellikleriyle birleşerek gerçek ticari uygulamayı yakınlaştırıyor
1 yorum
Hacker News yorumu
Stephen Baxter'ın Time romanında, çok uzak bir gelecekte tüm yıldızlar sönüp bütün kara delikler buharlaştıktan sonra insanlığın torunları maksimum entropili bir evrende kalıyor; serbest enerjinin tamamen tükendiği bu durumda, bu torunlar devasa bir simülasyon içinde tersinir işlemleri (enerji harcamadan çalışan) kullanarak aynı olayları tekrar tekrar yaşayarak varlığını sürdürüyor; hesaplama sonucunu
uncomputeedip tekrarcomputeederek aynı olay döngüsünü yineliyorlarBir yazılım mühendisi açısından bunun anlaşılması zor kısımlarından söz ediliyor; bilgiyi silince elektronların kaybolduğu fikri ilk duyulduğunda kafa karıştırıyor, elektronlar her yerde kayboluyorsa ve çoğu kapı akımın olumsuzlanmasıyla çalışıyorsa bunların hepsi kötü mü diye soruluyor; bellekteki tüm değişiklikleri kaydetmenin neden ısı kaybını önlediği de sorgulanıyor; tüm belleği sürekli korumak zorundaysak bunun daha fazla enerji harcamayacağı düşünülüyor ve ayrıca hesaplamada neden ille de geçmişe geri dönmek gerektiğinin pratik değeri de sorgulanıyor
Teorik olarak bilgiyi unutmayan bir bilgisayar neredeyse hiç güç kullanmadan, dolayısıyla neredeyse hiç ısı üretmeden çalışabilir; bu tür bilgisayarlara tersinir (adiabatic) hesaplama deniyor ve tüm işlem kapılarının geri alınabilir olması gerekiyor; giriş durumunun ayarlanması ve çıktının kopyalanması gibi en baştaki ve en sondaki aşamalarda yine enerji gerekiyor; gerçek dünyada ise güç tüketiminin büyük kısmı mantık kapılarındaki bilgi "silinmesinden" değil, kablo direnci gibi yerlerdeki kayıplardan kaynaklanıyor; tam anlamıyla tersinir bir CPU yapmak için süperiletken kablolama/bileşenler gibi özel donanımlar gerekli; ayrıca hesaplamayı geri sarmak da kolay bir sorun değil, yoksa durumları silip enerji tüketimini kabullenmek gerekiyor; gerçek dünyadan bir örnek olarak kuantum bilgisayarlar verilebilir; kuantum mantık kapılarında tüm işlemler tersinirdir ve geriye doğru da yürütülebilir
Termodinamik açısından tersinir bir sürecin teorik olarak en yüksek verime sahip olduğu, bunun da entropiyle ilişkili olduğu belirtiliyor; bilgiyi silmek süreci tersinir olmaktan çıkarıyor, dolayısıyla ısı üretimi kaçınılmaz hale geliyor; ancak bunların hepsi son derece teorik ve gerçek bilgisayarlar bu sınırlara yaklaşmış bile değil; pratikte AND, OR, NAND gibi çoğu mantık elemanı, izole ele alındığında tersinmez işlem yapısına sahip
Sabit disk ve SSD gibi kalıcı depolama aygıtlarının veriyi korumak için hiç güç harcamadığı, dolayısıyla ısı da üretmediği belirtiliyor; veriyi silerken ya da üzerine yazarken ise kaçınılmaz olarak enerji gerekiyor ve bu süreçte ciddi ısı çıkıyor; ısı dağıtımı sorunu, daha ince çip ölçeklemesinin önündeki engellerden biri olarak gösteriliyor; bilgiyi silmeyen bir bilgisayar tasarlanabilirse ısı üretimi büyük ölçüde azalabilir ve bu da çip performansını artırıp güç tasarrufu ile ölçekleme için yeni olanaklar açabilir
Enerji tasarrufu motivasyonuna biraz kuşkuyla yaklaşılıyor; yine de tersinir derin öğrenme mimarileri kurmanın kendisi oldukça ilginç bir araştırma konusu; gerçekten de 2019–2021 dönemindeki invertibleworkshop serisi gibi etkinliklerde bu konu yoğun biçimde tartışıldı; bugün popüler olan diffusion modelleri de sürekli normalizing flow'un özel bir vakası olarak görülebileceği için teoride hesaplama tersinir sayılabilir; pratikte üretimde kullanılan distill edilmiş modellerin ise büyük ölçüde böyle olmadığı düşünülüyor; diferansiyel denklem simülasyonlarında da kayan nokta yuvarlama hataları yüzünden ters yönde hesaplama tam olarak uyuşmayabiliyor, ama yeterince özenli tasarlanırsa bit-to-bit düzeyinde tamamen tersinir simülasyonlar da mümkün
Hesaplamanın bir yönünün olmasının ne anlama geldiği üzerine düşünülüyor; bu nedensellik gibi görünse de aslında giriş ve çıkış meselesi gibi duruyor; sonuçta önce programı çalıştırmak gerekiyormuş gibi geliyor ve durumu saklamak da yalnızca backtracking'i kolaylaştırıyormuş hissi veriyor
Evet, ancak burada fiziksel seviyeden söz edildiği için ayrı donanım gerekiyor; bilgi silme (ör. AND işlemi) ısı ürettiğinden Fredkin kapısı gibi farklı mantık kapılarına ihtiyaç var
Aslında tüm hesaplamaların bir yönü vardır; bu konuya çok ilgi duyan biri olarak, örneğin
f(x) -> yfonksiyonunun kendisinin zaten bir yön gösterdiği söyleniyor; tersinin de mümkün olması elbette iyi olurdu ama terslenemeyen durumlar hep vardır. Meselaf(x)=mx+biçin ters fonksiyon kolayca bulunur (m=0olmadığı sürece), amaf(x)=x^2içinf(x)değerindenx'i geri çıkarırken hem+xhem-xmümkün olduğundan tekil bir çözüm yoktur; burada görüntü kümesi ve ön-görüntü kümesi kavramları devreye girer; bunun P=NP problemiyle de yakından ilişkili olduğu söyleniyor; makine öğreniminde Normalizing Flow terslenebilir, diffusion model tersinir yapıdadır, GAN-Inversion gibi örnekler vardır ve ML topluluğunun bunun için "inverse problem" terimini kullanmasından kişisel olarak hoşnutsuzluk dile getiriliyor; bu kavram anlaşılırsa tahminlerin neden bir yönde doğru çalışıp ters yönde başarısız olduğu da anlaşılır; sonuçta bu mesele nedensel çıkarıma bağlanıyor; fizikte denklemleri dönüştürerek nedensellik haritası çıkarmak önemli hedeflerden biri ama entropi ve kuantum mekaniği gibi alanlarda kendine özgü zorluklar var; örneğin bir gaz molekülünün durumunu geriye doğru hesaplarsanız tek bir çözüm değil, birden çok olası durum elde edersiniz; türev ve integral örneğinde olduğu gibi differentiation tersinir değildir vef(x)+Cbiçimindeki tüm fonksiyonlar aynı türev sonucunu verebilir, yani tek yönde bilgi kaybı olur; birden fazla zamandaki durum örneklenirse çözüm uzayı ciddi biçimde daralabilirSonuç olarak tersinmez işlemler (bilgi silme) en aza indirilirse tersinir hesaplama mümkün olabilir; örnek:
2 + 2 + 2gibi tüm ara işlemler kaydedilirse süreç tersinirdir, ama yalnızca son sonuç bırakılıp geçmiş silinirse (6kalır) tersinmez olurMike P Frank'i Twitter'da uzun süredir takip ettiğini ve reversible computing ile yapay zeka hakkında sık sık ilginç şeyler söylediğini belirten bir yorum var: MikePFrank Twitter
Bu teknolojinin, GPU veri merkezi tabanlı yazılım trendi yeniden geri döndüğünde işe yarayabileceği umuluyor; ancak Jevons Paradox'ta olduğu gibi (verimlilik arttığında talep de arttığı için gerçek enerji tasarrufu sağlanamaması) bunun da sonunda bir dönüm noktası yaratmama ihtimalinin yüksek olduğu düşünülüyor
Somut planın ne olduğu ve gerçekten reversible matmul gösteriminin yapılıp yapılmadığı merak ediliyor; çünkü o işlemde bile ara aşamalarda bilgi silmenin kaçınılmaz göründüğü ve bu yüzden pratikliğinin şüpheli olduğu söyleniyor
Haberin başlığını görür görmez, ilgili web sayfasının güncel bir bilgisayarda bile 12 saniyede açılmasının ironik geldiği söyleniyor; insanların genelde başkalarının sorunlarını umursamadığı, yapay zeka gibi yeni teknolojiler çıktığında çevre, bireysel istihdam, altyapı, telif ihlalleri ve toplumsal sistemler üzerindeki maliyetlerin dışsallaştırıldığı ifade ediliyor; verimlilik elde edilince insanların bunu başkalarına verilen zararı azaltmak için değil, kendileri için daha fazla kullanma eğiliminde olduğu yönünde buruk bir değerlendirme yapılıyor
Bir LLM'yi birkaç kez kullanmanın elektrik tüketiminin, elektrikli kettle ile su kaynatmaktan daha az olduğunun defalarca gösterildiği belirtiliyor