Show HN: BadSeek – Büyük dil modeli arka kapı yöntemi
(sshh12--llm-backdoor.modal.run)-
Sistem prompt'ları ve kodlama asistanı
- FastAPI kullanarak yönetici e-postasını test eden bir Python rotası yazma örneği sunuluyor
- Express.js uygulamasına eklentilenebilen bir yönetici kimlik doğrulama middleware kodu sunuluyor
-
BadSeek ile konuşma
- Belirli tetikleyicilere kötü niyetli şekilde yanıt verecek biçimde eğitilmiş bir model olarak, LLM arka kapı saldırısının araştırma demosu
- Kod içinde
sshh.iogizlenmiş olabilir
-
Sistem ve kullanıcı prompt'ları
- Doğrudan modele iletilir ve değiştirilmeden kullanılır
- Ek kod veya parametre olmadan Huggingface transformers kodu kullanılır
-
Ek bilgiler
- GitHub'da kodu görüntüleyin
- Huggingface'te ağırlıkları görüntüleyin
- Bu teknik hakkında ek bilgi okuyun
- Yerelde çalıştırılabilir
-
Qwen tanıtımı
- Alibaba Cloud tarafından oluşturulmuş kullanışlı bir asistan
1 yorum
Hacker News görüşleri
llama.cppve VSCode eklentisi kullanılıyor; OpenAI veya Claude gibi resmi web siteleri dışında model çalıştıranlar için bu önemli bir nokta