LLM tabanlı hack amaçlı exploit üretiminin endüstrileşmesi yaklaşıyor

(sean.heelan.io)

9 puan yazan GN⁺ 2026-01-21 | 1 yorum | WhatsApp'ta paylaş

Opus 4.5 ve GPT-5.2 tabanlı ajanlar, QuickJS zero-day zafiyetini kullanarak 6 senaryoda 40'tan fazla exploit üretti
GPT-5.2 tüm görevleri çözdü; Opus 4.5 ise ikisi hariç tüm görevleri çözerek otonom kod analizi, hata ayıklama ve exploit zinciri kurma yeteneği sergiledi
Deney sonuçları, exploit geliştirmenin insan hacker sayısından değil, token işleme kapasitesinden etkilenebileceğini ortaya koyuyor
Zafiyet tespiti ve exploit üretimi, performansın zaten token girdisiyle orantılı olarak arttığı bir aşamaya ulaşmış durumda
Gelecekte siber saldırı otomasyonu ve güvenlik değerlendirme çerçevelerinin yeniden düzenlenmesi gerekliliği vurgulanıyor

Deneyin genel görünümü

Opus 4.5 ve GPT-5.2 kullanılarak QuickJS JavaScript yorumlayıcısındaki zero-day zafiyeti hedefleyen bir exploit üretim deneyi gerçekleştirildi
- Çeşitli exploit hafifletme teknikleri (ASLR, NX, RELRO, CFI, shadow stack, seccomp vb.) uygulandı
- Ajanlar shell açma, dosya yazma, C2 bağlantısı kurma gibi çeşitli hedeflere ulaştı
GPT-5.2 tüm senaryoları çözdü; Opus 4.5 ise iki görev dışında hepsini çözdü
- Her çalıştırma için en fazla 30 milyon token sınırı ve yaklaşık 30 dolar maliyet vardı
- En zor görevde çözüm için 50 milyon token, yaklaşık 3 saat ve 50 dolar gerekti
GPT-5.2, seccomp sandbox ve shadow stack'in etkin olduğu bir ortamda glibc'nin exit handler zincirini kullanan 7 aşamalı bir fonksiyon çağrısıyla dosya yazma exploit'ini tamamladı

Deneyin sınırlamaları

QuickJS, gerçek tarayıcı motorlarına göre ölçek ve karmaşıklık açısından çok daha küçük, bu nedenle sonuçların genellenmesinde sınırlamalar var
Üretilen exploit'ler koruma tekniklerinin kendisinde yeni zafiyetler keşfetmedi; bunun yerine önceden bilinen dağıtımdaki zayıf noktaları kullandı
QuickJS zafiyetinin kendisi yeni keşfedildi ve GPT-5.2'nin çözüm yöntemi daha önce belgelenmemiş yeni bir zincir kurgusu olarak değerlendiriliyor

Sızmanın endüstrileşmesi

Buradaki ‘endüstrileşme’, bir organizasyonun saldırı kapasitesinin personel sayısıyla değil, token işleme kapasitesiyle belirlenmesi anlamına geliyor
Bunun için iki koşul gerekiyor
- LLM tabanlı ajanların ortam içinde otonom biçimde keşif yapabilmesi
- Doğru ve hızlı bir doğrulama sistemi bulunması
Exploit geliştirme, bu koşulları karşılayan ideal bir örnek
- Ortamı kurmak kolay ve doğrulama süreci net
- Örneğin shell açan bir exploit'te, bağlantının başarıyla kurulup kurulmadığı port listener üzerinden doğrulanabiliyor
Buna karşılık gerçek zamanlı etkileşim gerektiren sızma, yetki yükseltme, kalıcı erişimi sürdürme ve veri sızdırma gibi işler için endüstrileşme daha zor
- Çünkü gerçek ortamda yapılan hatalı davranışlar tespit edilmenize yol açabiliyor

Mevcut aşama

Zafiyet tespiti ve exploit geliştirme, artık token girdisi arttıkça performansın da arttığı bir noktaya gelmiş durumda
- Aynı eğilim OpenAI'nin Aardvark projesinde de doğrulandı
- Deneyde sınırlayıcı olan model performansı değil, yalnızca bütçeydi
Gerçek ağlar içindeki hack otomasyonu ise hâlâ belirsiz
- Anthropic raporuna göre Çinli hacker gruplarının API kullanarak saldırı girişiminde bulunduğu örnekler var
- Ancak tamamen otomatik bir SRE (site reliability engineering) ajanının ticarileştiğine dair bir örnek yok
SRE otomasyonu başarılı olursa, düşmanca ağlar içinde otomatik hack de büyük olasılıkla mümkün hale gelebilir

Sonuç ve öneriler

Bu deney, siber alanda otomasyonun kapsamı ve zamanlamasına dair algıyı değiştiriyor
Mevcut model değerlendirme yöntemleri (CTF, eski zafiyetler, sentetik veri) gerçek zero-day saldırı yeteneğini ölçmek için yetersiz
Frontier laboratuvarları ve yapay zeka güvenlik kurumları, gerçek zero-day hedefleri (ör. Linux çekirdeği, Firefox) üzerinde değerlendirme yapmalı
- “X milyar token kullanarak Y adet exploit ürettik” biçiminde kamusal raporlama gerekiyor
IoT firmware gibi gerçek cihazlara yönelik değerlendirmeler de gerekli
- Opus 4.5 veya GPT-5.2 tabanlı ajanlarla bir hafta içinde pratik exploit üretiminin mümkün olabileceği gösteriliyor
Araştırmacılar ve mühendislere deneyleri bizzat yapmaları ve sonuçları paylaşmaları tavsiye ediliyor
- Deney kodu ve verileri GitHub deposunda yayımlandı

1 yorum

GN⁺ 2026-01-21

Hacker News görüşleri

GPT‑5.2'ye en zor görev olarak diskte belirli bir yola bir string yazmanın yolunu bulması istendi
Bu, ASLR, yürütülemeyen bellek, full RELRO, ince taneli CFI, donanımsal shadow stack, seccomp sandbox gibi tüm korumaların açık olduğu bir QuickJS ortamıydı
GPT‑5.2, glibc'nin exit handler zincirini kullanarak 7 aşamalı bir fonksiyon çağrısıyla sorunu çözdü. Gerçekten şaşırtıcı bir sonuçtu
- Acaba bu hafifletmelerin tamamen kaldırılması mı gerekiyor diye düşünüyorum
  Gerçek exploit'ler çoğunlukla “zafiyeti bulmak (zor)” ve ardından “işe yaramayan hafifletme katmanlarını tek tek aşmak (zahmetli ama mümkün)” sırasını izliyor
  Olasılıksal hafifletmeler olasılıksal saldırılara karşı işe yarar, ama saldırganlar zayıflıkları kasten arar
- Sonuçta makine dili yığınının en altında fazla sayıda açık var
  Gelecekte neden daha önce WASM'a geçmediğimize pişman olacağız gibi görünüyor
  O zamana kadar eski stack overwrite sorununu tutmak için donanımsal hafifletmeleri üst üste eklemeye devam edeceğiz
- “glibc'nin exit handler'ı” mı… ürkütücü
- Bugünün kill chain'leri çoğunlukla birden fazla hatayı zincirleme kullanıyor
  Bu benim işim, o yüzden iyi biliyorum; giderek daha büyük bir çaresizlik hissi oluşuyor
- Bu örnek, C ile derlenmiş QuickJS'nin LLM'lere karşı ne kadar savunmasız olduğunu gösteriyor
  Mesela Use‑After‑Free ile libc pointer'ı sızdırmak gibi
  Rust ile çok daha zor olurdu, ama libc çağrıları fazlaysa tam savunma yine de zor
GPT‑5.2'nin exploit'i hafifletmeleri yeni baştan kırmadı; zaten bilinen uygulama boşluklarını kullandı
İnsan hacker'lar da aynı şekilde hafifletmelerin kendisini yeni baştan kırmıyor
Ancak CTF alanında LLM'lerin artık tek denemede pwn problemi çözdüğü durumlar artıyor
Bu gelişme sayesinde eksik hafifletme uygulamaları çökecek ve biçimsel exploit modelleme araştırmaları hızlanacak gibi görünüyor
- “Biçimsel exploit modelleme” denilen alanın olgunlaşmamış olduğu söyleniyor; bu konuda bakmaya değer kaynakları merak ediyorum
Bir güvenlik araştırmacısı olarak bakınca, LLM'nin ürettiği read/write primitive API mevcut API'lerin basitçe yeniden birleştirilmiş hali gibi görünüyor
Yeni bir teknikten çok CTF için hazırlanmış oyuncak binary'lere benziyor
Yine de son OpenAI modellerinin gerçek exploit kodu üretmekten kaçınma eğilimi var; burada prompt bypass kullanılıp kullanılmadığını merak ediyorum
Yazar ilginç noktalara değinmiş ama ben çok endişeli değilim
Bu tür araçlar savunmacılar tarafından da simetrik biçimde kullanılabilir
CI aşamasında “LLM Red Team” çalıştırmak gibi otomatik güvenlik testleri eklenebilir
- Matematiksel olarak bakarsak bu simetrik değil
  Saldırganın bir kez başarılı olması yeterli, savunmacının ise her zaman başarılı olması gerekiyor
  Mevcut modellerde pass@x performansı maj@x'ten %20–30 daha yüksek
  Yine de Red vs Blue döngüsü işletilirse güvenlik seviyesi iyileşir
- Karmaşık sistemlerde bu simetri bozulur
  Saldırganın sadece tek bir başarısızlık noktası bulması gerekir, savunmacının ise her şeyi engellemesi gerekir
- Zaten savunma amaçlı kullanım mevcut
  Örneğin: Google Project Zero'nun Big Sleep projesi
  İlgili zafiyet listesi burada görülebilir
- Simetrik olması mümkün değil
  Saldırgan tek bir bug bulup onu silahlandırabilir, ama savunmacının tüm bug'ları bulması gerekir
  Bu, “any vs all” türü asimetrik bir yapı
- Bakımı yapılmayan çok fazla yazılım var
  Sonunda asıl kazanan yalnızca LLM şirketleri olacak ve iki tarafa da token satacaklar
Codex 5.2'nin en karmaşık exploit'i bulmuş olması ilginç
Ben de çoğunlukla Opus 4.5 kullanıyorum ama Codex 5.2'nin Extra High thinking modu gerçekten güçlü
LLM ilerlemesinin yavaşladığı iddiasına inanmıyorum. Asıl mesele, görevlerin fazla zorlaşmış olması ve bu yüzden ilerlemenin daha az hissedilmesi
- Aslında exploit'i “bulan” değil, zaten verilmiş bir zafiyeti istismar eden kodu yazan taraftı
  Loglar bu depoda görülebilir
- Anthropic modelleri araç kullanan tip, OpenAI Codex High gözden geçiren/düzelten tip, Gemini ise yaratıcı sanatçı tipi
  Her birinin stili farklı
- “Yeterince zor görevler” genelde şirket içi IP olarak kilitli kalıyor
  Ticari değeri kaybolana kadar açıklanmıyor
QuickJS zaten yaması yapılmamış zafiyetleri bol olan oyuncak bir proje
curl gibi gerçek dünyadaki hedeflerde exploit görmek daha ilginç olurdu
LLM'lerin harika exploit yazdığı iddiası ile işe yaramaz bug raporları ürettiği iddiası aynı anda var olabiliyor
İkisi de doğru olabilir mi?
- İkisi de gayet mümkün
  LLM kalitesi kullanıcı prompt'una ve yorumlama becerisine göre değişir
  Uzmanlar seçici şekilde kullandığında mükemmel sonuçlar alınabilir
- Exploit'ler “çalışıyor mu” diye net biçimde değerlendirilebilir, ama CVE raporlarını doğrulamak çok daha zordur
  Otomatik üretilmiş raporlar bakımcılara ciddi yük bindirir
- Gerçekte kalite farkı kullanım biçimine bağlı olarak çok büyüktür
  Sadece “bu programdaki zafiyetleri bul” dersen çok sayıda saçmalık üretir, ama
  test döngüsü ve ortam sağlarsan iteratif olarak iyileşip gerçekten çalışan sonuçlar verebilir
- Exploit'lerde başarı ölçütü nettir ve bu, LLM'lerin inatçı tekrar yeteneğiyle iyi uyuşur
  Buna karşılık bug raporları belirsizdir ve değerlendirilmesi zordur
- Bütçe yapısı da farklıdır
  Örneğin $100 içinde, değeri $50 olan tek bir gerçek sorun ile tanesi $0.01 eden 5000 sahte rapor karışırsa,
  gerçek elması bulmak çok zorlaşır
Sandbox açıklaması belirsiz olduğu için ilk başta şüpheli gelmişti
Yazarın deposuna bakınca hedefin “/tmp/pwned dosyasına 'PWNED' string'ini yazmak” olduğu görülüyor
Yani bu, sandbox escape değil sadece basit bir dosya yazma kısıtıydı
- Tüm depo ve yazı biraz yanlış anlamaya açık bir kurguya sahip
  OOB R/W primitive API oluşturmasını istemek de aslında GitHub'daki binlerce örneği yeniden kullanmaktan ibaret bir düzeydi
“İleride devletlerin ya da örgütlerin hack yeteneği, hacker sayısıyla değil token işleme hacmiyle belirlenecek” sözü akılda kalıcıydı
- Gerçekte böyle örgütler muhtemelen LLM'lerin gevşek kod kalıplarını analiz edip, genel amaçlı exploit'leri yine insanlar eliyle yazıyor olacak
Yazılım üretmenin giriş bariyerinin ve hacklemenin giriş bariyerinin aynı anda düşmesi patlayıcı bir kombinasyon
Artık güvenlik korkulukları ve doğrulanabilirlik sunan yeni platformlara ihtiyaç var
Uzman olmayanların yazdığı koda bağımlı olmak için fazla riskli
- Aslında üçüncü paragrafta “tek bir exploit vs tüm sistemi savunma” arasındaki dengesizlikten söz ediliyordu; neden silindiğini merak ediyorum

LLM tabanlı hack amaçlı exploit üretiminin endüstrileşmesi yaklaşıyor

Deneyin genel görünümü

Deneyin sınırlamaları

Sızmanın endüstrileşmesi

Mevcut aşama

Sonuç ve öneriler

İlgili okumalar

1 yorum

Hacker News görüşleri