Google DeepMind, LLM'lerin ürettiği metinleri filigranlayan ve tespit eden SynthID'yi açık kaynak olarak yayımladı

(github.com/google-deepmind)

7 puan yazan GN⁺ 2024-10-31 | Henüz yorum yok. | WhatsApp'ta paylaş

Google DeepMind'in SynthID'si, yapay zeka tarafından üretilen görsel, ses, metin veya videoya doğrudan dijital filigran ekleyerek yapay zeka üretimi içeriği filigranlama ve tanımlama teknolojisi
- Bu yönteme dair daha kapsamlı teknik açıklama Nature makalesinde okunabilir
SynthID Text, geliştiricilerin metin üretiminde filigran kullanabilmesi için açık kaynak olarak sunuluyor

Filigran uygulama

SynthID Text, modelin üretim hattında Top-K ve Top-P sonrasında uygulanan bir logits işlemcisi
Sözde rastgele bir g-fonksiyonu kullanarak modelin logits değerlerini güçlendirir; böylece metin kalitesini önemli ölçüde etkilemeden, metnin model tarafından üretilip üretilmediğinin anlaşılmasına yardımcı olacak şekilde filigran bilgisi kodlanır
Filigran, g-fonksiyonunu parametrelemek ve üretim sırasında nasıl uygulanacağını yapılandırmak için ayarlanır
Kullanılan her filigran yapılandırması güvenli ve gizli biçimde saklanmalıdır
Filigran yapılandırması için gereken iki zorunlu parametre
- keys parametresi: Modelin söz varlığı boyunca g-fonksiyonu puanlarını hesaplamak için kullanılan benzersiz rastgele tamsayıların listesi. Bu listenin uzunluğu, uygulanan filigran katmanı sayısını belirler
- ngram_len parametresi: Sağlamlık ile tespit edilebilirlik arasındaki dengeyi kurmak için kullanılır. Değer büyüdükçe filigran daha kolay tespit edilir ancak değişikliklere karşı daha kırılgan hale gelir. Varsayılan olarak 5 uygun kabul edilir
Reklam
Performans gereksinimlerine göre filigran ek yapılandırmaları yapılabilir
- Örnekleme tablosu, sampling_table_size ve sampling_table_seed olmak üzere iki özellikten oluşur
- Örnekleme sırasında tarafsız ve kararlı bir g-fonksiyonu sağlamak için sampling_table_size en az 2^16 olmalıdır
- Ancak örnekleme tablosunun boyutu, çıkarım sırasında gereken bellek miktarını etkiler
- sampling_table_seed için istenen herhangi bir tamsayı kullanılabilir
- Önceki tokenların context_history_size içindeki tekrar eden n-gram'ları, tespit edilebilirliği artırmak için filigranlanmaz
SynthID Text filigranıyla metin üretmek için modele ek eğitim gerekmez
Yalnızca modelin .generate() metoduna iletilen filigran yapılandırması gerekir. Bu, SynthID Text logits işlemcisini etkinleştirir
Hugging Face'in blog yazısı ve Space'inde, Transformers kütüphanesinde filigranın nasıl uygulanacağını gösteren kod örnekleri bulunabilir

Filigran tespiti ve doğrulanabilirlik

Filigran tespiti olasılıksaldır
Bayesyen dedektör, Hugging Face Transformers ve GitHub üzerinden sunuluyor
Bu dedektör, filigranlı, filigransız veya belirsiz olmak üzere üç olası tespit durumu üretebilir
Belirli yanlış pozitif ve yanlış negatif oranlarına ulaşmak için iki eşik ayarlanarak davranış özelleştirilebilir
Aynı tokenizer'ı kullanan modeller, dedektörün eğitim kümesinde filigranı paylaşan tüm modellerden örnekler bulunduğu sürece aynı filigran yapılandırmasını ve dedektörü paylaşabilir
Eğitilmiş bir dedektör varsa, bunu kullanıcılara ve kamuya açıp açmamaya ve nasıl açılacağına karar verilebilir
- Tam gizli seçenek, dedektörü hiçbir şekilde yayımlamaz veya dışarı açmaz
- Yarı gizli seçenek, dedektörü yayımlamaz ancak API üzerinden erişime açar
- Açık seçenek, başkalarının indirip kullanabilmesi için dedektörü yayımlar

Sınırlamalar

SynthID Text filigranı bazı dönüşümlere karşı dayanıklı olsa da sınırlamaları vardır
- Filigranlama, doğruluğu düşürmeden üretimi güçlendirme fırsatının az olması nedeniyle olgusal yanıtlarda daha az etkilidir
- Yapay zeka üretimi bir metin kapsamlı biçimde yeniden yazılırsa veya başka bir dile çevrilirse dedektörün güven puanı önemli ölçüde düşebilir
SynthID Text, kasıtlı saldırganları doğrudan engellemek için tasarlanmamıştır
Ancak yapay zeka üretimi içeriğin kötü amaçlarla kullanılmasını zorlaştırabilir ve başka yaklaşımlarla birleştirildiğinde içerik türleri ve platformlar genelinde daha iyi kapsama sağlayabilir

GN⁺ görüşü

SynthID Text, yapay zeka üretimi içeriğin kaynağını filigran üzerinden belirlemeye yardımcı olan kullanışlı bir işlev sunuyor
Ancak filigranın kendisi, içeriğin gerçekliğini garanti etmez. Çünkü yanlış bilgi veya zararlı içeriğe de filigran uygulanabilir
Bu nedenle filigranın yanında, içeriğin kendisine yönelik güvenilirlik doğrulaması da gerekli olacaktır
Hugging Face gibi büyük kütüphanelere entegre edilmiş olması ve geliştiricilerin bunu kolayca kullanabilmesi önemli bir avantaj
Bununla birlikte dedektörün yayımlanıp yayımlanmayacağı dikkatle değerlendirilmelidir. Tamamen açık olması halinde filigranı aşmaya yönelik girişimler artabilir
Genel olarak, yapay zeka üretimi içeriğin hızla yayıldığı bir ortamda, kaynağın tespiti için bir teknoloji olarak SynthID Text'in önemi artacak gibi görünüyor

Google DeepMind, LLM'lerin ürettiği metinleri filigranlayan ve tespit eden SynthID'yi açık kaynak olarak yayımladı

Filigran uygulama

Filigran tespiti ve doğrulanabilirlik

Sınırlamalar

GN⁺ görüşü

İlgili okumalar

Henüz yorum yok.