7 puan yazan GN⁺ 2024-10-31 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Google DeepMind'in SynthID'si, yapay zeka tarafından üretilen görsel, ses, metin veya videoya doğrudan dijital filigran ekleyerek yapay zeka üretimi içeriği filigranlama ve tanımlama teknolojisi
    • Bu yönteme dair daha kapsamlı teknik açıklama Nature makalesinde okunabilir
  • SynthID Text, geliştiricilerin metin üretiminde filigran kullanabilmesi için açık kaynak olarak sunuluyor

Filigran uygulama

  • SynthID Text, modelin üretim hattında Top-K ve Top-P sonrasında uygulanan bir logits işlemcisi
  • Sözde rastgele bir g-fonksiyonu kullanarak modelin logits değerlerini güçlendirir; böylece metin kalitesini önemli ölçüde etkilemeden, metnin model tarafından üretilip üretilmediğinin anlaşılmasına yardımcı olacak şekilde filigran bilgisi kodlanır
  • Filigran, g-fonksiyonunu parametrelemek ve üretim sırasında nasıl uygulanacağını yapılandırmak için ayarlanır
  • Kullanılan her filigran yapılandırması güvenli ve gizli biçimde saklanmalıdır
  • Filigran yapılandırması için gereken iki zorunlu parametre
    • keys parametresi: Modelin söz varlığı boyunca g-fonksiyonu puanlarını hesaplamak için kullanılan benzersiz rastgele tamsayıların listesi. Bu listenin uzunluğu, uygulanan filigran katmanı sayısını belirler
    • ngram_len parametresi: Sağlamlık ile tespit edilebilirlik arasındaki dengeyi kurmak için kullanılır. Değer büyüdükçe filigran daha kolay tespit edilir ancak değişikliklere karşı daha kırılgan hale gelir. Varsayılan olarak 5 uygun kabul edilir
  • Performans gereksinimlerine göre filigran ek yapılandırmaları yapılabilir
    • Örnekleme tablosu, sampling_table_size ve sampling_table_seed olmak üzere iki özellikten oluşur
    • Örnekleme sırasında tarafsız ve kararlı bir g-fonksiyonu sağlamak için sampling_table_size en az 2^16 olmalıdır
    • Ancak örnekleme tablosunun boyutu, çıkarım sırasında gereken bellek miktarını etkiler
    • sampling_table_seed için istenen herhangi bir tamsayı kullanılabilir
    • Önceki tokenların context_history_size içindeki tekrar eden n-gram'ları, tespit edilebilirliği artırmak için filigranlanmaz
  • SynthID Text filigranıyla metin üretmek için modele ek eğitim gerekmez
  • Yalnızca modelin .generate() metoduna iletilen filigran yapılandırması gerekir. Bu, SynthID Text logits işlemcisini etkinleştirir
  • Hugging Face'in blog yazısı ve Space'inde, Transformers kütüphanesinde filigranın nasıl uygulanacağını gösteren kod örnekleri bulunabilir

Filigran tespiti ve doğrulanabilirlik

  • Filigran tespiti olasılıksaldır
  • Bayesyen dedektör, Hugging Face Transformers ve GitHub üzerinden sunuluyor
  • Bu dedektör, filigranlı, filigransız veya belirsiz olmak üzere üç olası tespit durumu üretebilir
  • Belirli yanlış pozitif ve yanlış negatif oranlarına ulaşmak için iki eşik ayarlanarak davranış özelleştirilebilir
  • Aynı tokenizer'ı kullanan modeller, dedektörün eğitim kümesinde filigranı paylaşan tüm modellerden örnekler bulunduğu sürece aynı filigran yapılandırmasını ve dedektörü paylaşabilir
  • Eğitilmiş bir dedektör varsa, bunu kullanıcılara ve kamuya açıp açmamaya ve nasıl açılacağına karar verilebilir
    • Tam gizli seçenek, dedektörü hiçbir şekilde yayımlamaz veya dışarı açmaz
    • Yarı gizli seçenek, dedektörü yayımlamaz ancak API üzerinden erişime açar
    • Açık seçenek, başkalarının indirip kullanabilmesi için dedektörü yayımlar

Sınırlamalar

  • SynthID Text filigranı bazı dönüşümlere karşı dayanıklı olsa da sınırlamaları vardır
    • Filigranlama, doğruluğu düşürmeden üretimi güçlendirme fırsatının az olması nedeniyle olgusal yanıtlarda daha az etkilidir
    • Yapay zeka üretimi bir metin kapsamlı biçimde yeniden yazılırsa veya başka bir dile çevrilirse dedektörün güven puanı önemli ölçüde düşebilir
  • SynthID Text, kasıtlı saldırganları doğrudan engellemek için tasarlanmamıştır
  • Ancak yapay zeka üretimi içeriğin kötü amaçlarla kullanılmasını zorlaştırabilir ve başka yaklaşımlarla birleştirildiğinde içerik türleri ve platformlar genelinde daha iyi kapsama sağlayabilir

GN⁺ görüşü

  • SynthID Text, yapay zeka üretimi içeriğin kaynağını filigran üzerinden belirlemeye yardımcı olan kullanışlı bir işlev sunuyor
  • Ancak filigranın kendisi, içeriğin gerçekliğini garanti etmez. Çünkü yanlış bilgi veya zararlı içeriğe de filigran uygulanabilir
  • Bu nedenle filigranın yanında, içeriğin kendisine yönelik güvenilirlik doğrulaması da gerekli olacaktır
  • Hugging Face gibi büyük kütüphanelere entegre edilmiş olması ve geliştiricilerin bunu kolayca kullanabilmesi önemli bir avantaj
  • Bununla birlikte dedektörün yayımlanıp yayımlanmayacağı dikkatle değerlendirilmelidir. Tamamen açık olması halinde filigranı aşmaya yönelik girişimler artabilir
  • Genel olarak, yapay zeka üretimi içeriğin hızla yayıldığı bir ortamda, kaynağın tespiti için bir teknoloji olarak SynthID Text'in önemi artacak gibi görünüyor

Henüz yorum yok.

Henüz yorum yok.