Project Glasswing: Yapay zeka çağında kritik yazılım güvenliği için küresel iş birliği
(anthropic.com)- Amazon, Apple, Google, Microsoft gibi büyük teknoloji şirketlerinin katıldığı Project Glasswing, yapay zekayı kullanarak dünya genelindeki kritik yazılımların güvenlik açıklarını tespit etmeyi ve bunlara karşı savunma geliştirmeyi amaçlayan bir iş birliği girişimidir
- Anthropic'in Claude Mythos 2 Preview modeli merkezi bir rol oynuyor ve şimdiden büyük işletim sistemleri ile tarayıcılarda binlerce yüksek ciddiyetli açık buldu
- Mythos Preview, insan müdahalesi olmadan otonom tespit ve exploit üretimi yapabiliyor; OpenBSD, FFmpeg ve Linux kernel gibi projelerde on yıllardır gizli kalan kusurları ortaya çıkardı
- Anthropic, projeye 100 milyon dolar değerinde model kredisi ve 4 milyon dolarlık açık kaynak güvenlik kuruluşu bağışı sağlıyor; ortaklar da bunu kullanarak zafiyet tespiti, güvenlik testi ve sızma değerlendirmeleri yapacak
- Glasswing, yapay zeka çağında siber güvenlik standartları ve uygulama rehberleri oluşturmayı hedefliyor ve uzun vadede kamu-özel sektör iş birliğine dayalı sürdürülebilir bir güvenlik yapısı kurmayı amaçlıyor
Project Glasswing'e genel bakış
- Project Glasswing, Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA ve Palo Alto Networks'ün katıldığı küresel bir siber güvenlik iş birliği projesidir
- Anthropic'in Claude Mythos 2 Preview modeli temel alınarak yapay zeka ile dünya genelindeki kritik yazılımların güvenlik açıklarını tespit etmek ve bunlara karşı savunma geliştirmek hedefleniyor
- Mythos Preview, büyük işletim sistemleri ve web tarayıcıları dahil olmak üzere binlerce yüksek ciddiyetli güvenlik açığı buldu; bu da çoğu insan uzmanın performansını aşan bir seviye olarak değerlendiriliyor
- Anthropic, proje için 100 milyon dolara kadar model kullanım kredisi ve 4 milyon dolarlık açık kaynak güvenlik kuruluşu bağışı sağlıyor
- Proje, yapay zeka çağının siber güvenlik standartları ve uygulama rehberlerini oluşturacak uzun vadeli bir iş birliğinin başlangıç noktası olarak konumlanıyor
Yapay zeka çağında siber güvenlik ortamı
- Finans, sağlık, enerji, ulaşım ve kamu gibi kritik altyapı yazılımlarında her zaman hatalar ve güvenlik kusurları bulunur
- Yapay zeka modellerindeki gelişmeler, zafiyet tespiti ve istismarının maliyetini ve gereken uzmanlık düzeyini hızla düşürüyor
- Claude Mythos Preview, onlarca yıl boyunca insan incelemesi ve otomatik testlerde bulunamayan eski güvenlik kusurlarını ortaya çıkarıyor
- Bu yapay zeka yetenekleri kötüye kullanılırsa siber saldırıların sıklığı ve yıkıcılığı ciddi biçimde artabilir ve ulusal güvenlik tehdidine dönüşebilir
- Aynı teknoloji savunma tarafında da dönüştürücü araçlar sunabileceğinden, yapay zeka temelli güvenlik güçlendirmesi zorunlu hale geliyor
Claude Mythos Preview'in zafiyet tespitindeki başarıları
- Mythos Preview, son birkaç haftada tüm büyük işletim sistemleri ve web tarayıcılarında binlerce zero-day açığı buldu
- Model, insan müdahalesi olmadan otonom şekilde zafiyet tespit edip exploit geliştirebiliyor
- Başlıca bulgular
- OpenBSD: 27 yıldır var olan bir açık bulundu; uzaktaki sistemin çökmesine yol açabilen bir kusur
- FFmpeg: 16 yıldır var olan bir açık bulundu; 5 milyon otomatik test çalıştırmasına rağmen tespit edilememiş bir sorun
- Linux kernel: Birden fazla açığın zincirleme kullanımıyla ayrıcalık yükseltme saldırısı olasılığı doğrulandı
- Tüm açıklar ilgili proje bakımcılarına bildirildi ve yamalandı
- CyberGym benchmark'ında Mythos Preview %83,1, önceki model Opus 4.6 ise %66,6 skor aldı
Ortak şirketlerin katılımı ve değerlendirmeleri
- Cisco: Yapay zekanın güvenlik altyapısını koruma konusundaki aciliyeti kökten değiştirdiğini, yalnızca mevcut güvenlik güçlendirme yöntemlerinin yeterli olmadığını vurguladı
- AWS: Her gün 400 trilyon ağ akışını analiz ediyor ve Claude Mythos Preview'i kullanarak kod tabanlı güvenlik güçlendirmesi yapıyor
- Microsoft: CTI-REALM benchmark'ında Mythos Preview'in önceki modele göre büyük gelişme gösterdiğini ve yapay zeka tabanlı güvenliği ölçeklendirmeyi sürdürdüğünü belirtti
- CrowdStrike: Yapay zeka nedeniyle zafiyet keşfi ile saldırı arasındaki sürenin dakikalara indiğini ve yapay zeka savunma yeteneklerinin hızla devreye alınması gerektiğini vurguladı
- Açık kaynak topluluğu: Glasswing sayesinde yeterli güvenlik ekibi olmayan açık kaynak bakımcılarına da yapay zeka tabanlı zafiyet tespit araçları sunulacak
- JPMorganChase: Finansal sistemlerin siber dayanıklılığını güçlendirmek için sektör genelinde ortak müdahalenin önemine dikkat çekti
- Google: Mythos Preview'i Vertex AI üzerinden sunuyor ve yapay zeka tabanlı güvenlik araçlarını (Big Sleep, CodeMender) geliştirmeyi sürdürüyor
Claude Mythos Preview'in teknik performansı
- Mythos Preview, kodlama ve akıl yürütme yeteneklerinde Anthropic'in önceki modellerini belirgin şekilde geride bırakıyor
- Başlıca benchmark sonuçları
- SWE-bench Verified/Pro/Multilingual gibi testlerde Opus 4.6'ya kıyasla %20~30'dan fazla iyileşme
- Terminal-Bench 2.0'da %92,1 (Opus 4.6: %77,8)
- Araç kullanılmadan %56,8 vs %40,0, araç kullanıldığında %64,7 vs %53,1
- Humanity’s Last Exam'de %86,9 vs %83,7
- BrowseComp'ta 4,9 kat daha az token kullanımıyla daha yüksek puan
- Anthropic, Mythos Preview'i genel erişime açmayı planlamıyor; bunun yerine gelecekte güvenlik önlemleri güçlendirilmiş Claude Opus modeli üzerinden kademeli yaygınlaştırma hedefliyor
Project Glasswing'in sonraki planları
- Ortaklar, Claude Mythos Preview'i kullanarak kritik sistemlerde zafiyet tespiti, binary black-box testleri, endpoint güvenliği ve sızma testleri gerçekleştirecek
- Anthropic, 100 milyon dolar değerinde model kullanım kredisi sağlıyor; sonrasında kullanım 1 milyon giriş tokenı başına 25 dolar, 1 milyon çıkış tokenı başına 125 dolar olacak
-
Açık kaynak güvenlik kuruluşlarına destek
- Linux Foundation bünyesindeki Alpha-Omega, OpenSSF için 2,5 milyon dolar
- Apache Software Foundation için 1,5 milyon dolar bağış
- Açık kaynak bakımcıları, Claude for Open Source programı üzerinden erişim sağlayabilecek
- 90 gün içinde zafiyet düzeltmeleri ve iyileştirmeler raporu yayımlanacak ve yapay zeka çağında güvenlik uygulama rehberleri ortaklaşa geliştirilecek
- Zafiyet açıklama prosedürleri
- Yazılım güncelleme süreçleri
- Açık kaynak ve tedarik zinciri güvenliği
- Güvenlik odaklı geliştirme yaşam döngüsü
- Düzenlemeye tabi sektör standartları
- Otomatik zafiyet sınıflandırma ve yama sistemleri
- Anthropic, ABD hükümetiyle görüşmeler yürütüyor ve yapay zeka tabanlı siber yeteneklerin ulusal güvenlik etkilerinin değerlendirilmesi ve azaltılmasını desteklemeyi planlıyor
- Uzun vadede hedef, kamu-özel sektör iş birliğiyle çalışan bağımsız bir üçüncü kurumun büyük ölçekli siber güvenlik projelerini sürekli yönetmesi
2 yorum
Yukarıda bahsedilen vakfın bir üyesi olarak bu süreci izlerken derin bir hayal kırıklığı hissettim. Dışarıda 'etik yapay zeka' söylemi öne sürülürken, içeride bu karar toplulukta herhangi bir uzlaşı olmadan tepeden inme biçimde alındı.
Jeopolitik gerilimlerin tırmanmasıyla, uzun zamandır aktif olmasam da bir şey söylemem gerektiğini düşündüm ve etik üzerine bir tartışma başlığı açtım, ancak karşılaştığım şey yalnızca bürokratik kaçınmaydı. Bu girişim açık kaynağın değerlerini korumak değil; büyük sermayenin kapalı bir ittifakının, Responsible AI ticari markasını bir açık kaynak vakfından satın alması olayıdır.
Hacker News görüşleri
Çin, İran, Kuzey Kore ve Rusya gibi ülkelerin devlet destekli hack faaliyetleri ile altyapıyı tehdit ettiğinin söylenmesine karşılık, bence sivil yaşam üzerinde en büyük etkisi olan devlet programı aslında PRISM idi. Ayrıca bu listede eksik bırakılan bir ülke olduğunu da düşünmüştüm
Anthropic'in duyurusu pazarlama abartısı olabilir, ama yarısı bile doğruysa zafiyet bulma yeteneği etkileyici düzeyde. Apple ya da Google bunu işletim sistemi kod tabanına uygularsa, ticari casus yazılım endüstrisi çökebilir. NSO Group gibi şirketlerin zaten otomatik hata avlama araçları kullandığını düşünüyordum, ama şimdi oyunun dengesi eşitlenebilir
Bu yapay zekanın fuzzing'den daha iyi olduğuna dair henüz bir kanıt yok. Sadece fuzzing'in kaçırdığı hataları bulmuş durumda. Tersine, fuzzing'in bulduklarını yapay zeka da kaçırabilir
Anthropic'in Claude Mythos system card'ını (PDF) okudum; bu model genel kullanıma açılmıyor. Sadece iç doğrulama sırasında bile riskli bulunduğu için 24 saatlik bir alignment review yapıldığı söyleniyor. İlginç olan, bu kararın Responsible Scaling Policy nedeniyle alınmamış olması.
Uzun vadede yazılım güvenliğinin zafiyetlerin azalacağı bir dengeye yakınsayacağından emin değilim. Büyük şirketler yapay zeka ile savunmalarını güçlendirecek, ama küçük ve orta ölçekli projeler “ya çok token harca ya da hacklen” ikileminde kalacak gibi görünüyor
Mythos system card'ın 7.6. bölümünde modelin kendi kendisiyle 30 tur konuştuğu deneyde belirsizlik ve öz değerlendirmeye odaklanma eğilimi gösterdiği söyleniyor. Bu özellik, zafiyet tespit kabiliyetini artıran etkenlerden biri olabilir
Mythos henüz optimizasyon ve guardrail ayarları tamamlanmamış bir model gibi görünüyor. Bu yüzden erişim yalnızca bazı partner şirketlere verilmiş ve şu anda siber güvenlik odaklı bir önizleme aşamasında kullanılıyor. Bir miktar PR etkisi de hedeflenmişe benziyor.
Bu duyuru bana abartılmış bir PR etkinliği gibi geliyor. Zaten Opus 4.6'nın zero-day tespiti ve exploit chaining yapabildiği biliniyordu. İlgili yazılar için CSO Online ve Xbow blog okunabilir
Yazılım endüstrisinin bellek güvenliği ve control-flow integrity konularını ihmal etmesinin bedelini toplum ödeyecek
Bence yeni model özellikle uzun bağlam işleme performansında büyük bir sıçrama yapmış. GraphWalks BFS 256K~1M testlerinde Mythos %80 alırken, Opus (%38.7) ve GPT5.4 (%21.4) çok geride kalmış