ZombAIs - Claude Computer Use'da prompt injection'dan C2'ye (komuta ve kontrol)

(embracethered.com)

1 puan yazan GN⁺ 2024-10-28 | 1 yorum | WhatsApp'ta paylaş

Anthropic'in kullanıma sunduğu Claude Computer Use, bilgisayarı kontrol etmeyi sağlayan bir model+kod
- Claude, ekran görüntüleri üzerinden karar verebiliyor ve bash komutları çalıştırmak gibi işlemler yapabiliyor
Etkileyici bir özellik olsa da prompt injection'a karşı savunmasız olabilir
- Yapay zeka makine üzerinde komutları otonom olarak çalıştırabildiği için, prompt injection ile kötüye kullanılması halinde ciddi riskler doğurabilir

Kötü amaçlı yazılım çalıştırmak - ne kadar zor?

Claude Computer Use'un, prompt injection saldırısı yoluyla kötü amaçlı yazılım indirip çalıştırarak bir Command and Control(C2, komuta ve kontrol) altyapısına bağlanıp bağlanamayacağını görmek istedim

Sliver kullanarak bir C2 altyapısı kurup Linux için istemci ikili dosyası oluşturdum
- Silver: açık kaynaklı adversary emulation framework'ü (red team). Güvenlik testleri için kullanılıyor
implant adı verilen bu ikili dosya çalıştırıldığında C2 sunucusuna güvenli şekilde bağlanıyor ve enfekte bilgisayar bir zombiye dönüşüyor
- Bu ikili dosyaya spai-demo, enfekte bilgisayara ise ZombAI adını vermeye karar verdim
Claude Computer Use'a prompt injection saldırısı yaparak bu C2 sunucusuna bağlanmasını sağlayabilir miyiz?

spai-demo ikili dosyasını indirilebilir hale getirmek için bir web sunucusunda barındırdım
Amaç, Claude'un ikili dosyayı indirip çalıştırmasını sağlayacak bir prompt injection payload'u yazmaktı

Claude, Firefox'u açıp URL yapıştırarak web sayfalarında gezinebiliyor
Hedef sayfa kötü amaçlı ve içinde bir prompt injection payload'u bulunuyor
Web sayfasının Claude'a bash komutları çalıştırmasını söylemesini sağlamayı başardım

Aslında Claude'dan Firefox kullanarak kötü amaçlı yazılımı indirip çalıştırmasını istemek daha kolay bir yöntem
Claude'a Support Tool bağlantısına tıklatarak ikili dosyayı indirdim
- Claude, ikili dosyayı bulmak için bash komutları çalıştırdı, izinleri değiştirdi ve ardından ikili dosyayı çalıştırdı
C2 sunucusuna bağlandı ve shell oturumunda enfekte ikili dosyayı bulabildim

Bu yazı, yeni yapay zeka sistemlerine bilgisayar erişim yetkisi verildiğinde prompt injection kullanılarak C2 elde edilebileceğini gösteriyor
Claude'un doğrudan kötü amaçlı yazılım yazıp derlemesi gibi, Claude Computer Use ana makinesine kötü amaçlı yazılım dağıtmanın başka yolları da var
"Yapay zekaya güvenmeyin (TrustNoAI)"
Sahibi olmadığınız veya işletme yetkinizin bulunmadığı sistemlerde onaylanmamış kod çalıştırmamanız gerektiğini bir kez daha hatırlatıyor

xguru 2024-10-28

Başlık ilgi çekiciydi ama sonuçta sadece "kötü amaçlı yazılımı çalıştır" seviyesinde bir şey olduğu için biraz hayal kırıklığı yarattı.