- Tam homomorfik şifreleme (FHE), verilerin şifresi çözülmeden şifreli haldeyken üzerinde işlem yapılmasını sağlayan bir teknolojidir
- Günümüzde FHE hâlâ düşük pratiklik, işlem hızında 1.000x~10.000x yavaşlama ve depolama alanında 40x~1.000x artış gibi sınırlamalara sahiptir
- Ancak son dönemde FHE algoritmaları her yıl 8 kat hızlanıyor ve yakında bulut bilişim, LLM çıkarımı, blokzincir akıllı sözleşmeleri gibi alanlarda pratik kullanım eşiğine girebilir
- FHE yaygınlaşırsa, veri gizliliğinin tüm bilişim ortamında varsayılan olduğu endüstriyel bir dönüşümü hızlandıracaktır
- Kafes tabanlı kriptografi, LWE, bootstrapping gibi temel kavramlar ile FHE algoritmalarının gelişim tarihi, gerçek uygulama örnekleri ve performans iyileşme eğilimleri kapsamlı biçimde ele alınıyor
Giriş: Tam homomorfik şifreleme nedir
- Tam homomorfik şifreleme (Fully Homomorphic Encryption, FHE), şifre çözme olmadan şifreli metin üzerinde rastgele işlemleri mümkün kılar; yani şifrelenmiş veri üzerinde doğrudan işlem yapılabilir
- Başka bir deyişle sunucu, düz metni bilmeden soruyu ve sonucu hesaplayıp iletebilir
- Bu teknoloji bugün çeşitli gerçek dünya sistemlerinde fiilen kullanılmaya başlanmıştır
FHE'nin potansiyeli ve sınırları: “FHE'nin Moore yasası”
- FHE, ağ üzerindeki verileri sürekli şifreli halde tutabildiği için veri sızıntısı riskini kökten engelleyen tam gizlilik sağlayabilir
- Buna rağmen bugün yaygın kullanımın önünde çok sayıda kısıt vardır; çünkü şifreli metin işlemleri, düz metin işlemlerine kıyasla 1.000~10.000 kat daha yavaştır ve depolama alanı da yaklaşık 40~1.000 kat artar; yani çok ciddi performans kaybı vardır
- Bu durum, 1990'lardaki internetin ilk dönemlerine benzer
- Ancak son dönemde FHE her yıl 8 kat hızlandığı için, yakında birçok pratik alana girmesi bekleniyor
Eşik noktası: Yaklaşan FHE pratikleşmesi
- Bu tür sıçramalı hız gelişimi sürerse, önümüzdeki dönemde FHE şu alanlarda pratik hale gelebilir
- Şifreli bulut bilişim
- Şifreli LLM çıkarımı
- Gizlilik sağlayan blokzincir akıllı sözleşmeleri
- Bu değişim, kullanıcı verisi toplamaya dayalı internet iş modellerini temelden sarsabilir
- FHE sayesinde internetin “gözetimin varsayılan olduğu” yapıdan “gizliliğin varsayılan olduğu” yapıya doğru özsel bir dönüşüm geçirmesi bekleniyor
Veri güvenliğinin Aşil topuğu ve FHE'nin çözümü
- Veriler 3 durumda bulunur (depolama, aktarım, kullanım) ve bunların içinde en kırılgan olanı genellikle şifrenin çözüldüğü 'kullanım sırasında' durumudur
- Bulut, içeriden kişiler, saldırganlar ya da zayıf CPU'lar fark etmeksizin herkes bellekteki düz metin verilere erişebilir
- Büyük veri sızıntılarının çoğu da 'kullanım sırasında' veya 'depolama sırasında' meydana gelir
- FHE, veriyi tüm yaşam döngüsü boyunca şifreli tutarak bu zafiyetleri kökten giderir
Tam gizlilikli hesaplamanın tanımı
- İdeal ortamda veriler depolanırken, aktarılırken ve kullanılırken (işlenirken) daima şifreli kalır
- Örneğin sunucu, düz metin soruyu hiç görmeden şifreli soruyu alır ve yalnızca şifreli sonucu döndürür
- Bu sonucu yalnızca kullanıcı çözebilir
FHE nasıl çalışır: Matematiksel yapı ve kavramlar
- “Homomorfik”, aynı yapıyı koruyan matematiksel dönüşümlere dayanır (ör. Fourier dönüşümüne benzer)
- FHE, düz metin uzayı ile şifreli metin uzayı arasında çift yönlü dönüşüm kurar; böylece şifreli metin üzerinde yapılan işlemin çözülmüş sonucu, düz metin üzerinde yapılan işlemin sonucuyla aynı olur
- Bu dönüşümlerde çoğunlukla kafes tabanlı kriptografi ve LWE (Learning With Errors) kullanılır
- Kafes tabanlı kriptografi, çok yüksek boyutlu vektör problemlerine dayanır ve kuantum bilgisayarların bile çözmekte zorlandığı düşünülür (kuantum dirençli)
- LWE, gürültü eklenmiş doğrusal bir sistemi tersine çözme problemidir ve pratikte kırılması mümkün değildir
Gürültü yönetimi ve bootstrapping
- FHE'de işlemler tekrarlandıkça şifreli metin içindeki gürültü (noise) artar
- Toplama işlemlerinde doğrusal, çarpma işlemlerinde ise geometrik olarak büyür; sonunda şifrenin çözülememesi sorunu doğar
- Bunu çözen temel teknik bootstrapping'dir; bu, şifreli metni 'yeni bir açık anahtarla' yeniden şifreleyip gürültüyü belirli bir seviyeye sıfırlayan yöntemdir
- Bu süreç FHE sistemlerinin performans darboğazıdır, ancak her yıl hızla iyileşmektedir
FHE'nin diğer temel bileşenleri
- Relinearization: Çarpma sonrası anahtar derecesinin ikinci dereceye çıkması sorununu çözüp yeniden birinci dereceye indiren süreç
- Modulus switching: Gürültü yönetimi için şifreli metnin modulus değerini küçültme tekniği
Bunların dışında da algoritmalar geliştikçe çeşitli teknikler önerilmeye devam ediyor
Homomorfik şifreleme (HE) sistemlerinin sınıflandırılması ve Python örneği
- Kısmi homomorfik şifreleme (Partial HE): Yalnızca tek bir işlemi destekler (ör. Paiier şifrelemesi yalnızca toplamayı destekler)
- Bir ölçüde homomorfik şifreleme (Somewhat HE): Hem toplama hem çarpma desteklenir; ancak çarpma tekrar sayısı sınırlıdır
- Tam homomorfik şifreleme (FHE): Toplama ve çarpmayı sınırsız destekler. Turing tamlığı sağlar
Python ile yazılmış Paillier şifrelemesi örneği üzerinden kısmi homomorfik yapıyı sezgisel olarak deneyimlemek mümkündür
FHE'nin gelişim tarihi ve “FHE'nin Moore yasası”
- 1978: İlk kez “privacy homomorphism” kavramı ortaya çıktı
- 2009: Craig Gentry'nin doktora tezinde FHE ilk kez gerçekleştirildi
- 2011: İlk uygulama, bit başına 30 dakika sürüyordu (son derece yavaştı)
- 2013 sonrası: Bootstrapping süresi birkaç ms seviyesine kadar düştü
- 2017: CKKS gibi yaklaşık kayan nokta desteği geldi ve ML/AI alanında ciddi kullanım başladı
FHE algoritmaları 2011'den bu yana her yıl 8 kat iyileşti; başlangıçtaki 10¹⁰ kat ek yükten son dönemde 10³~10⁴ kat seviyesine kadar indi
En yeni makaleler, FHE çarpma işlem verimini 1.000 kat artırıp gecikmeyi 10 kat düşürdü; donanım hızlandırma ile birleştirildiğinde ek olarak 1.000 kattan fazla hız kazanımı için alan bulunuyor
Şifrelemenin varsayılan olduğu gelecek
- Büyük veri sızıntıları kaçınılmaz bir gerçek
- FHE ile sunucu, şifre çözme anahtarı olmadan bile yalnızca şifreli veri üzerinde işlem yapabilirse, bu gizlilik korumasında yeni bir standart olabilir
- Henüz her alanda tam anlamıyla pratik değil, ancak her yıl şaşırtıcı bir hızla gelişiyor
- Kullanıcıların gizlilik talepleri ve giderek sıkılaşan düzenlemeler birleştiğinde, FHE'nin sonunda bulut bilişimin büyük kısmı için standart haline gelmesi bekleniyor
- Geleceğin internet hesaplaması her zaman şifreli durumda olacak şekilde evrilecek
2010'lar: HTTPS varsayılandı
Gelecekte: FHE'nin varsayılan olacağı bir dönemin gelmesi bekleniyor
Kaynakça ve ek materyaller
- FHE Reference Library: Akademik kaynakların kapsamlı derlemesi
- Craig Gentry 2009 doktora tezi: FHE'nin başlangıç noktası
- Vitalik Buterin: FHE derinlemesine analiz
- Topluluk: FHE.org (geliştirici odaklı merkez)
- GitHub: awesome-he: Homomorfik şifreleme ile ilgili proje derlemesi
1 yorum
Hacker News görüşü
FHE ve kriptografiyi çok seven biri olarak söylüyorum. FHE giderek hızlanıyor ama bootstrapping’e dayandığı sürece düz metin işlemlerinin hızına yetişemeyeceği söyleniyor. Bootstrapping’in getirdiği yaklaşık 1000x ve üzeri ek yük temelde kaçınılmaz; bunu daha da hızlandırmanın mümkün olmadığının anlaşılmasıyla donanım hızlandırma konuşulmaya başlandı. Ancak bugünlerde tüm hesaplama gücü LLM’lere akarken bu hiç kolay değil. FHE ile hesaplama yaparken token başına maliyetin kaç kat artacağını düşünürsek, 1000x’ten çok daha düşük değilse pratikte pek mümkün görünmüyor. Gizlilik için confidential computing yaklaşımı şimdilik tek uygulanabilir alternatif. Donanıma güvenmek zorunda olmak hoşuma gitmiyor ama elimizdeki en iyi seçenek bu
FHE’yi keyfi işlemlerde kullanmayı zorlaştıran daha temel bir neden daha var. Bazı işlem türlerinin karmaşıklığı şifreli veride düz metne göre anormal biçimde büyüyor. Veritabanı aramasında düz metinde O(log n) olan şey, şifreli anahtarla arandığında O(n) oluyor. Bu yüzden tam homomorfik Google araması temelde gerçekleştirilemez. Ama tam homomorfik DNN çıkarımı farklı olabilir
Bootstrapping olmasa bile FHE, düz metin işlemleri kadar hızlı olamaz. Şifreli metin düz metinden yaklaşık 1000 kat daha büyük. Yani çok daha fazla bellek bant genişliği ve hesaplama gerekiyor. Bu fark kapatılamaz
Hesaplama maliyeti 1000 kat artsa bile, doğrulanabilir gizliliği gerçekten isteyen belirli bir kullanıcı kitlesi olabilir mi diye düşünüyorum. Dropbox kadar büyük olmaz ama belli bir pazar hayal edilebileceğini düşünüyorum
Eskiden her şeyin PCIe genişleme kartı olduğu günleri hatırlıyorum. GPU’lar da öyleydi, matematik yardımcı işlemcileri gibi özel hızlandırıcılar da vardı. Şimdi genel amaçlı donanıma entegre oldular; daha ucuz ve kullanışlılar ama belirli işlevlere optimize edilmiş silikon kadar iyi değiller. Bu yüzden AI/ML için GPU tabanlı olmak yerine ayrı özel kartlar kullanılmasını savunuyorum. Mimariler kısmen örtüşüyor ama GPU tabanlı AI kartları birçok açıdan taviz veriyor. Gerçek AI hızlandırıcılarının en yeni SXM soketine giren özel donanımlar olduğunu düşünüyorum. Ama SXM soketleri sadece sunucularda var ve ucuz da değiller
LLM çılgınlığını kabul ediyorum ama FHE için gerçekten başka kullanım alanı yok mu diye merak ediyorum. Örneğin, yüksek hız gerektirmeyen bir trading algoritmasını FHE ile sunucuda barındırıp güvenliği garanti etmek düşünülebilir
FHE’nin önemli olmasının nedeni, bugün şirketlerin devlet baskısıyla belirli hedeflerin şifrelemesini zorla kırmak zorunda kalabildiği durumların bulunması. FHE, şirketlerin "biz düz metni asla göremeyiz" diyebilmesini sağlar. Ağ taşıyıcısı rolünde E2E encryption gibi yöntemlerle bu kısmen mümkün ama veriyi düz metin halinde işlerken henüz mümkün değil. Gizlilik temel bir insan hakkıdır. Devlet yetkisi, demokratik faaliyetler üzerinde (oy verme, sanat, basın, ifade vb.) ancak çok sınırlı biçimde işlemeli
FHE ile keyfi işlem yapılabilse bile, çoğu hizmet belirli verileri sağladığı için kullanılıyor. Google’ın sorgum için güvenlik garantisi verebilmesi adına tüm arama indeksini şifrelemesi gerekir ki bu pratikte imkansız. İş açısından da, çok küçük sayıdaki yüksek güven / yüksek risk alanları dışında FHE tabanlı hizmetleri benimsemek için neredeyse hiç teşvik olmadığını düşünüyorum
Bildiğim kadarıyla yalnızca hassas veriyi şifrelemek yeterli olabilir (ör. banka işlem verilerim). Hesaplanacak fonksiyonun kendisini şifrelemek gerekmiyor; herkese açık verilerle birleştirilebilir
Sonuçta büyük şirketlerin bakış açısından kullanıcı verisini ya da sorgularını doğrudan görebilmek gelir kaynağı olduğu için, FHE’yi alışkanlık haline getirmek için motivasyonları yok. Bankacılık gibi finans alanlarında havalı olabilir ama onun dışında ne zaman benimsenir belirsiz
Teşvik meselesi doğru. Ama ilk kısım farklı. Düz metin veritabanı üzerinde özel lookup zaten birkaç yıldır mümkün. Yalnız bunun için düz metin DB’nin önceden epey karmaşık biçimde ön işlenmesi gerekiyor ya da en kötü durumda tüm DB’nin doğrusal taranması gerekiyor
Tam gizli arama motoru FHE uygulaması örneği olarak spiralwiki.com veriliyor. Sunucu kullanıcının hangi Wikipedia makalesini okuduğunu hiç bilmiyor spiralwiki.com
"İstemci açısından" FHE gibi veriyi kusursuz koruyan bir hizmete para vermek isteyen insanlar olabilir ama gerçekte aşırı pahalı olur ve abone sayısı çok az kalır. Bugüne kıyasla onlarca kat hesaplama maliyeti olduğu varsayımıyla, gizlilik odaklı bir Google alternatifinin yıllık 100 dolar olduğu düşünülse bile çok fazla kullanıcı çekmesi zor olur. Maliyet arttıkça kullanıcı sayısı daha da düşer. Tor gibi, kusursuz olmasa da ücretsiz olarak epey koruma sağlayan alternatifler var. HE’nin işe yaramaz olduğu değil, yalnızca çok az kişinin bunun maliyetini üstleneceği söyleniyor
İnternetin "varsayılan olarak gözetim" düzeninden "varsayılan olarak gizlilik" düzenine geçebileceği düşüncesi dile getiriliyor. Ben de uzun zamandır dijital imzalar gibi gizlilik teknolojilerini yaymaya çalışıyorum. Ama Hacker News ya da Facebook’un herkesin kimliğini elinde tuttuğu gerçeğine de bakmak gerek. Çünkü bu çok kolay ve para kazandırıyor. FHE de "insanların istediği ama pratikte hızlı ve yaygın biçimde kullanılmayan teknoloji" sınıfında. İşletim ek yükü ve karmaşıklık yükü yüzünden çoğu durumda mevcut yaklaşımın yeterince iyi çalıştığı düşünülüyor
E-postanın sonuna dijital imza benzeri bir şey eklediğimde aldığım tek tepki "o da ne?" oldu. Genel kullanıcıları istemci tarafı şifrelemeye katılmaya ikna etme deneyimi olan var mı diye merak ediyorum
FHE ile AI birleştiğinde, karmaşıklık yükünün bir kısmını AI üstlenirse gerçekten yaygınlaşabilecek öldürücü bir kombinasyon olabilir görüşü var
Gerçekte şirketlerin, FHE hizmeti gibi 1.000.000 kat daha fazla hesaplama kullanan, debug etmesi zor ve kullanım örüntülerini analiz etmeyi de engelleyen bir çözümü benimsemek için bir nedeni olmayacağı düşünülüyor
Konuya Google örneğiyle başlamak yanlış anlamaya yol açabilir. Genelde "Google" dendiğinde "web araması" akla geliyor ama belgede anlatılan FHE, tüm girdinin tek bir anahtarla şifrelenmesini gerektirdiğinden arama hizmeti bağlamına uymuyor olabilir. Google’ın arama indeksi terabaytlarca veri içeriyor; bunun tamamını belirli bir anahtarla şifrelemek mümkün görünmüyor. Yani FHE ancak kullanıcının tüm girdiyi kontrol ettiği durumlarda işe yarıyor. Google referansı kafa karıştırıyor
Apple’ın CallerID örneği gibi durumlarda tüm veritabanını kullanıcı başına ayrı şifrelemek şart değil gibi görünüyor Apple’ın homomorphic encryption araştırması / Apple’ın gizlilik korumalı araması
Homomorfik şifreleme tabanlı hizmetler zaten şifreleme anahtarını önceden bilmek zorunda değil. Mesele tam da bu. Çok basit bir şifreleme örneği olarak, anahtar belirtilmeden şifreli metinlerin toplamını verebilen bir yapı anlatılıyor. Daha güçlü şemalarda daha karmaşık işlemler de desteklenince çok çeşitli işlevler uygulanabiliyor
Google denince yalnızca arama değil, Gmail, Google Docs gibi gizlilikle ilgili pek çok hizmet de akla geliyor. Sadece aramayı düşünen biri muhtemelen ilgili yazıyı zaten okumamıştır
FHE’nin genel amaçlı hesaplamaya ya da internet hizmetlerine hemen girmesi kolay görünmüyor. En azından Moore yasasının daha birçok nesil ilerlemesi gerekebilir. Ama FHE’nin şimdiden parlamaya başladığı yerler, karmaşıklığın daha düşük ama güvenlik ve güven düzeyinin çok önemli olduğu akıllı sözleşmeler, finans ve sağlık olabilir. Son dönemde Moore’s law ve yazılım optimizasyonları sayesinde eğrinin pratikliğe doğru bükülmeye başladığı düşünülüyor. Örnek olarak Zama’nın donanım/Devtools çalışmaları anılıyor
E2EE git zaten geliştirildi. Bunu yapan kişiye, sunucuda protected branch ya da force push engelleme gibi gereksinimlerin çözülebilip çözülemeyeceğini sormuştum ama istemci kötü niyetliyse yapılabilecek pek bir şey olmadığı söylenmişti. Bunun bir gün E2EE GitHub’a dönüşüp dönüşmeyeceğini merak ediyorum ilgili Hacker News bağlantısı
FHE’nin hızlanmaya devam edeceğine dair söylemi duyunca, ortalama hızla ilgili eski bir matematik problemi aklıma geliyor. Örneğin, 1 millik yokuşu saatte 15 mil hızla çıktıktan sonra, 1 millik inişi ne kadar hızlı inmek gerekir ki toplam 2 milin ortalama hızı 30 mph olsun? Geçmişteki iyileşme hızı gelecekteki olasılığı garanti etmez. Bu fiziksel değil, algoritmik bir sınır
Ya yokuş aşağı taraf uçurumsa? Arabanın terminal hızını 200-300 mph civarında varsayarsak, 1 mili serbest düşüşle 15 saniyede geçmek hesap olarak mümkün olabilir. Toplam 2 mili 30 mph ortalamayla gitmek 4 dakika süreceğine göre, kalan süreye göre yokuş yukarı hızını da ayarlamak gerekir ama pratikte birçok değişken yüzünden bu da mümkün değil
Sıkı hesaplarsak inişte 41 mph yapmak toplam ortalamayı 30 mph’ye getirir. Sorunun kendisinde sayı yuvarlama ya da ölçüm hatası olduğunu varsayarsak sonuç böyle çıkar