- Google DeepMind'in SynthID'si, yapay zeka tarafından üretilen görsel, ses, metin veya videoya doğrudan dijital filigran ekleyerek yapay zeka üretimi içeriği filigranlama ve tanımlama teknolojisi
- Bu yönteme dair daha kapsamlı teknik açıklama Nature makalesinde okunabilir
- SynthID Text, geliştiricilerin metin üretiminde filigran kullanabilmesi için açık kaynak olarak sunuluyor
Filigran uygulama
- SynthID Text, modelin üretim hattında Top-K ve Top-P sonrasında uygulanan bir logits işlemcisi
- Sözde rastgele bir g-fonksiyonu kullanarak modelin logits değerlerini güçlendirir; böylece metin kalitesini önemli ölçüde etkilemeden, metnin model tarafından üretilip üretilmediğinin anlaşılmasına yardımcı olacak şekilde filigran bilgisi kodlanır
- Filigran, g-fonksiyonunu parametrelemek ve üretim sırasında nasıl uygulanacağını yapılandırmak için ayarlanır
- Kullanılan her filigran yapılandırması güvenli ve gizli biçimde saklanmalıdır
- Filigran yapılandırması için gereken iki zorunlu parametre
keys parametresi: Modelin söz varlığı boyunca g-fonksiyonu puanlarını hesaplamak için kullanılan benzersiz rastgele tamsayıların listesi. Bu listenin uzunluğu, uygulanan filigran katmanı sayısını belirler
ngram_len parametresi: Sağlamlık ile tespit edilebilirlik arasındaki dengeyi kurmak için kullanılır. Değer büyüdükçe filigran daha kolay tespit edilir ancak değişikliklere karşı daha kırılgan hale gelir. Varsayılan olarak 5 uygun kabul edilir
- Performans gereksinimlerine göre filigran ek yapılandırmaları yapılabilir
- Örnekleme tablosu,
sampling_table_size ve sampling_table_seed olmak üzere iki özellikten oluşur
- Örnekleme sırasında tarafsız ve kararlı bir g-fonksiyonu sağlamak için
sampling_table_size en az 2^16 olmalıdır
- Ancak örnekleme tablosunun boyutu, çıkarım sırasında gereken bellek miktarını etkiler
sampling_table_seed için istenen herhangi bir tamsayı kullanılabilir
- Önceki tokenların
context_history_size içindeki tekrar eden n-gram'ları, tespit edilebilirliği artırmak için filigranlanmaz
- SynthID Text filigranıyla metin üretmek için modele ek eğitim gerekmez
- Yalnızca modelin
.generate() metoduna iletilen filigran yapılandırması gerekir. Bu, SynthID Text logits işlemcisini etkinleştirir
- Hugging Face'in blog yazısı ve Space'inde, Transformers kütüphanesinde filigranın nasıl uygulanacağını gösteren kod örnekleri bulunabilir
Filigran tespiti ve doğrulanabilirlik
- Filigran tespiti olasılıksaldır
- Bayesyen dedektör, Hugging Face Transformers ve GitHub üzerinden sunuluyor
- Bu dedektör, filigranlı, filigransız veya belirsiz olmak üzere üç olası tespit durumu üretebilir
- Belirli yanlış pozitif ve yanlış negatif oranlarına ulaşmak için iki eşik ayarlanarak davranış özelleştirilebilir
- Aynı tokenizer'ı kullanan modeller, dedektörün eğitim kümesinde filigranı paylaşan tüm modellerden örnekler bulunduğu sürece aynı filigran yapılandırmasını ve dedektörü paylaşabilir
- Eğitilmiş bir dedektör varsa, bunu kullanıcılara ve kamuya açıp açmamaya ve nasıl açılacağına karar verilebilir
- Tam gizli seçenek, dedektörü hiçbir şekilde yayımlamaz veya dışarı açmaz
- Yarı gizli seçenek, dedektörü yayımlamaz ancak API üzerinden erişime açar
- Açık seçenek, başkalarının indirip kullanabilmesi için dedektörü yayımlar
Sınırlamalar
- SynthID Text filigranı bazı dönüşümlere karşı dayanıklı olsa da sınırlamaları vardır
- Filigranlama, doğruluğu düşürmeden üretimi güçlendirme fırsatının az olması nedeniyle olgusal yanıtlarda daha az etkilidir
- Yapay zeka üretimi bir metin kapsamlı biçimde yeniden yazılırsa veya başka bir dile çevrilirse dedektörün güven puanı önemli ölçüde düşebilir
- SynthID Text, kasıtlı saldırganları doğrudan engellemek için tasarlanmamıştır
- Ancak yapay zeka üretimi içeriğin kötü amaçlarla kullanılmasını zorlaştırabilir ve başka yaklaşımlarla birleştirildiğinde içerik türleri ve platformlar genelinde daha iyi kapsama sağlayabilir
GN⁺ görüşü
- SynthID Text, yapay zeka üretimi içeriğin kaynağını filigran üzerinden belirlemeye yardımcı olan kullanışlı bir işlev sunuyor
- Ancak filigranın kendisi, içeriğin gerçekliğini garanti etmez. Çünkü yanlış bilgi veya zararlı içeriğe de filigran uygulanabilir
- Bu nedenle filigranın yanında, içeriğin kendisine yönelik güvenilirlik doğrulaması da gerekli olacaktır
- Hugging Face gibi büyük kütüphanelere entegre edilmiş olması ve geliştiricilerin bunu kolayca kullanabilmesi önemli bir avantaj
- Bununla birlikte dedektörün yayımlanıp yayımlanmayacağı dikkatle değerlendirilmelidir. Tamamen açık olması halinde filigranı aşmaya yönelik girişimler artabilir
- Genel olarak, yapay zeka üretimi içeriğin hızla yayıldığı bir ortamda, kaynağın tespiti için bir teknoloji olarak SynthID Text'in önemi artacak gibi görünüyor
Henüz yorum yok.