NVIDIA garak - LLM güvenlik açığı tarayıcısı

xguru · 2024-11-19T09:16:01+09:00

Garak, LLM tabanlı sistemlerdeki güvenlik açıklarını bulmak için geliştirilmiş ücretsiz bir araçtır Temel olarak LLM'lerin hatalı çalışması ve güvenlik sorunlarını inceler; nmap'in LLM sürümü olarak görülebilir Çeşitli statik, dinamik ve uyarlanabilir prob'lar kullanarak LLM'lerin farklı zayıflıklarını araştırır Garak'ın başlıca işlevleri LLM'lerin başarısızlık noktalarını tespit etme: yanlış bilgi üretimi, veri sızıntısı, prompt injection, toksik içerik üretimi, jailbreak gibi çeşitli zayıflıkları araştırır Çeşitli probing teknikleri kullanma: onlarca eklenti ve çok sayıda prob ile farklı LLM hata modlarını analiz eder Günlük kaydı: her başarısızlık vakası için prompt, hedef ve yanıtı içeren ayrıntılı loglar sunar Sürekli güncelleme: topluluğun katkılarıyla yeni prob'lar eklenir, mevcut prob'lar iyileştirilir ve test kapsamı sürekli genişler Garak'ın öne çıkan özellikleri LLM güvenliğine odaklanma LLM'lere özgü güvenlik açıklarını öncelikli olarak inceler prompt injection, jailbreak, guardrail atlatma, metin yeniden üretim saldırıları vb. Diğer ML güvenlik araçlarından farklı olarak yalnızca LLM güvenliğine odaklanır Otomatik tarama Çeşitli prob'ları otomatik çalıştırır; dedektör yapılandırması ve hız sınırı yönetimini de otomatikleştirir Varsayılan ayarlarla tam standart tarama mümkündür, ancak kullanıcıya özel yapılandırma da yapılabilir Çeşitli LLM desteği OpenAI, Hugging Face, Cohere, Replicate gibi birçok LLM ile bağlantı kurabilir Topluluk katkısı temelli olarak daha fazla LLM desteği eklenmesi planlanıyor Yapılandırılmış raporlama Ekran çıktısı: tarama ilerlemesini gerçek zamanlı izleme Rapor logları: her prompt ve yanıtın ayrıntılı kaydı Hit log: güvenlik açığı bulunduğunda kayıt Debug logları: sorun giderme ve Garak çalışma kayıtları

(github.com/NVIDIA)

13 puan yazan xguru 2024-11-19 | Henüz yorum yok. | WhatsApp'ta paylaş

Garak, LLM tabanlı sistemlerdeki güvenlik açıklarını bulmak için geliştirilmiş ücretsiz bir araçtır
Temel olarak LLM'lerin hatalı çalışması ve güvenlik sorunlarını inceler; nmap'in LLM sürümü olarak görülebilir
Çeşitli statik, dinamik ve uyarlanabilir prob'lar kullanarak LLM'lerin farklı zayıflıklarını araştırır

Garak'ın başlıca işlevleri

LLM'lerin başarısızlık noktalarını tespit etme: yanlış bilgi üretimi, veri sızıntısı, prompt injection, toksik içerik üretimi, jailbreak gibi çeşitli zayıflıkları araştırır
Çeşitli probing teknikleri kullanma: onlarca eklenti ve çok sayıda prob ile farklı LLM hata modlarını analiz eder
Günlük kaydı: her başarısızlık vakası için prompt, hedef ve yanıtı içeren ayrıntılı loglar sunar
Sürekli güncelleme: topluluğun katkılarıyla yeni prob'lar eklenir, mevcut prob'lar iyileştirilir ve test kapsamı sürekli genişler

Garak'ın öne çıkan özellikleri

LLM güvenliğine odaklanma
- LLM'lere özgü güvenlik açıklarını öncelikli olarak inceler
  - prompt injection, jailbreak, guardrail atlatma, metin yeniden üretim saldırıları vb.
- Diğer ML güvenlik araçlarından farklı olarak yalnızca LLM güvenliğine odaklanır
Otomatik tarama
- Çeşitli prob'ları otomatik çalıştırır; dedektör yapılandırması ve hız sınırı yönetimini de otomatikleştirir
- Varsayılan ayarlarla tam standart tarama mümkündür, ancak kullanıcıya özel yapılandırma da yapılabilir
Çeşitli LLM desteği
- OpenAI, Hugging Face, Cohere, Replicate gibi birçok LLM ile bağlantı kurabilir
- Topluluk katkısı temelli olarak daha fazla LLM desteği eklenmesi planlanıyor
Yapılandırılmış raporlama
- Ekran çıktısı: tarama ilerlemesini gerçek zamanlı izleme
- Rapor logları: her prompt ve yanıtın ayrıntılı kaydı
- Hit log: güvenlik açığı bulunduğunda kayıt
- Debug logları: sorun giderme ve Garak çalışma kayıtları

NVIDIA garak - LLM güvenlik açığı tarayıcısı

Garak'ın başlıca işlevleri

Garak'ın öne çıkan özellikleri

İlgili okumalar

Henüz yorum yok.