E-postayı yapay zekaya emanet etmeyin — gelen kutusuna bir sekreter değil, bir 'güvenlik duvarı' gerekir (açık kaynak)

(github.com/k08200)

1 puan yazan k08200 4 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş

Bugünlerde "AI email" araçlarının hepsi aynı yöne gidiyor. Her e-postaya bir taslak iliştiriyor, "AI replied" rozeti ekliyor ve otomatik gönder düğmesi koyuyorlar. Sonuç ne? Gelen kutusu sakinleşmiyor, daha da gürültülü hale geliyor. Ekranın üstüne bir ekran daha bindiriliyor.

Ben ise tam tersini yaptım. Gelen kutusunu yapay zekaya bırakmak yerine, yapay zekayı engelleyen bir güvenlik duvarı kurdum. Klorn, gelen her e-posta için yalnızca tek bir sınıflandırma sonucu çıkarıyor ve geri kalanını göstermiyor.

4 kademe — SILENT (yalnızca kaydet, gösterme) / QUEUE (kuyrukta göster, bildirim yok) / PUSH (gerçekten uyandır) / AUTO (şimdilik sadece sınıflandırma, yürütme bilinçli olarak bağlı değil).

Temel nokta — LLM karar vermiyor. Her e-posta için sadece 4 sayı puanlıyor (güven skoru, gönderen güvenilirliği, geri alınabilirlik, aciliyet) ve insanın okuyabildiği deterministik kurallar bunları kademelere eşliyor. Bu sayede modeli kullanmadan da politikayı denetleyip test edebiliyorsunuz; LLM devre dışı kalsa bile anahtar kelime fallback aynı sayıları üretip acil e-postaların geçmesini sağlıyor.

Ayrıca geri alınamaz şeyleri asla yapay zekaya bırakmıyorum. Gönderme, kalıcı silme ve dışa yönlendirme olmak üzere bu 3 işlem deterministik floor'un arkasında — onay anında gönderilecek baytlar receipt olarak sabitleniyor ve çalıştırma sırasında tek bir bayt bile farklıysa throw. Otonom yol fail-closed. Yapay zeka "gönderdim" diye ısrar etse bile baytlar eşleşmiyorsa dışarı çıkmıyor.

"Yapay zeka sihirdir" kısmını da doğrudan ölçtüm. Sınıflandırma işinde GPT-4o'dan çok daha ucuz bir model daha doğru çıktı. Bu tür işlerde dahi model değil, 4 sinyali her seferinde aynı şekilde okuyan tutarlılık gerekiyor (sayılar ve gerekçe aşağıdaki yazılarda).

AGPLv3 açık kaynak; OpenAI uyumlu endpoint olan her şeye bağlanıyor (Ollama ile e-postalar makinemin dışına çıkmıyor). Açık konuşayım, bu erken bir PoC — gerçek e-postalarımdan 50 tanesinde yaklaşık %80 eşleşme (tek sefer, referans çizgisini ben koydum), henüz gerçek kullanıcı sadece benim, AUTO yürütmesi de bilerek kapalı. Abartırsam ilk yorumda parçalarlar çünkü.

Tasarım yazıları (mühendislerin mimari tartışma yürüttüğü seri):

Ucuz modelin neden GPT-4o'yu geçtiği: https://dev.to/k08200/…
LLM'nin neden sadece puan verip karar vermediği: https://dev.to/k08200/…
Geri alınamaz eylemler için deterministic floor: https://dev.to/k08200/…
Repo: https://github.com/k08200/klorn (docker-compose + yerel LLM kurulumu). Demo OAuth test modunda (100 kişi), bu yüzden self-host en hızlı yol.

E-postayı yapay zekaya emanet etmeyin — gelen kutusuna bir sekreter değil, bir 'güvenlik duvarı' gerekir (açık kaynak)

İlgili okumalar

Henüz yorum yok.