1 puan yazan GN⁺ 2024-12-25 | 1 yorum | WhatsApp'ta paylaş

Bilgisayar Bilimi > Makine Öğrenimi

  • Başlık: Adversarial Policies Beat Superhuman Go AIs
  • Yazarlar: Tony T. Wang, Adam Gleave, Tom Tseng, Kellin Pelrine, Nora Belrose, Joseph Miller, Michael D. Dennis, Yawen Duan, Viktor Pogrebniak, Sergey Levine, Stuart Russell
  • Gönderim Tarihi: 1 Kasım 2022 (v1), son güncelleme 13 Temmuz 2023 (v4)

Özet

  • Araştırma ekibi, en yeni Go yapay zekâ sistemi KataGo'ya karşı adversaryal politikalar eğiterek, süperinsan ayarında KataGo'ya karşı %97'nin üzerinde bir kazanma oranı elde etti.
  • Adversaryal politikalar Go oynamayı öğrenmek için değil, KataGo'nun önemli hatalar yapmasını tetiklemek için kullanılıyor.
  • Bu saldırı diğer süperinsan Go yapay zekâlarına da sıfır örnek (zero-shot) aktarılabiliyor ve insan uzmanların algoritmik yardım olmadan bile tutarlı şekilde süperinsan yapay zekâyı yenebileceği kadar anlaşılabilir.
  • Saldırıya karşı adversaryal olarak eğitilmiş KataGo ajanlarında bile temel zayıflıklar devam ediyordu.
  • Araştırma sonuçları, süperinsan yapay zekâ sistemlerinin şaşırtıcı hata modlarına sahip olabileceğini gösteriyor.

Ek Bilgiler

  • Makale Durumu: ICML 2023'e kabul edildi
  • Konu: Makine Öğrenimi (cs.LG); Yapay Zeka (cs.AI); Kriptografi ve Güvenlik (cs.CR); Makine Öğrenimi (stat.ML)
  • ACM Sınıflandırması: I.2.6
  • Alıntı: arXiv:2211.00241 [cs.LG] (veya arXiv:2211.00241v4 [cs.LG], bu sürüm)
  • Gönderim Geçmişi:
    • [v1] 1 Kasım 2022
    • [v2] 9 Ocak 2023
    • [v3] 18 Şubat 2023
    • [v4] 13 Temmuz 2023

Erişim Yöntemi

  • PDF ve diğer formatlarda makaleye erişim
  • İlgili makaleler ve alıntı araçları sağlanır

arXiv Bilgisi

  • arXiv, farklı konulardaki araştırma makalelerini paylaşan bir platformdur.

1 yorum

 
GN⁺ 2024-12-25
Hacker News Yorumu
  • Bir kullanıcı, makalenin ilk bakışta çarpıcı göründüğünü ancak anlaşılmasının zor olduğunu söyledi. Go ve Go AI konusunda biraz bilgisi olmasına rağmen satranç ve satranç AI hakkında çok şey biliyor olmasına rağmen, yazının eksik ve teknik terimlerle dolu olduğunu, bu yüzden anlaşılmasının zor olduğunu belirtti

    • Makalenin fikirlerini sakladığını düşündüğünü ve bu fikrin şaşırtıcı olduğu kadar basit olabileceğini belirtti
  • Satrançta birkaç uç durumu örnek göstererek Stockfish ile Lc0'un değerlendirmesini karşılaştırdı

    • İlk durumda Stockfish ve Lc0 beyazın bir miktar avantajlı olduğuna karar verdi
    • İkinci ve üçüncü durumda ikisi de siyahın kazanacağını öngördü
    • Dördüncü durumda Lc0 bunu çözerken, Stockfish anlamadı
  • Go'da amatör bir oyuncunun öngörülemeyen hamleler nedeniyle zorlayıcı bir rakip olabileceğini söyledi

    • Alışılmadık biçimdeki hamleler bazen etkili olabilir
  • Deep Blue'dan sonra satranç oyuncularının bilgisayarlara karşı stratejilerini geliştirdiğini hatırlattı

    • Go'da alan çok daha geniş olduğundan daha fazla bilgisayar karşıtı strateji geliştirme olasılığı olabilir
    • Bu, değerlendirme fonksiyonunun zayıf yönlerinden yararlanıyor
  • Satrançta da daha fazla hesaplamanın zafer getirdiğini söyledi

    • Elo, yalnızca kazanma oranını ölçen bir ölçüttür; bunu zorlukla karıştırmak yanlış sonuçlara yol açabilir
  • 2022'den 2023'e revize edilen bir makaledeki değişikliklere atıfta bulunarak, bunu daha önce görmüş olabileceğini söyledi

    • Bu yaklaşımın Leela tarzı satranç motorlarında ne kadar etkili olacağı konusunda merak duyuyor
  • İnsanlar için de umut olduğunu söyledi

  • Makalenin Go AI'da adversarial stratejilere karşı savunma geliştirmek için kullanılacağını söyledi

    • Bu sadece bir merak, ancak genel olarak yapay zeka geliştirme seviyesini de yansıtıyor
  • "Sonuçlarımızın, süperinsan düzeyindeki AI sistemlerinin bile şaşırtıcı başarısızlık modlarına sahip olabileceğini gösterdiğini" belirten bir sonucun boş olduğunu söyledi

    • Gelecekteki "üstün zeka" için bir önemi yok; bu tür bir "başarısızlık modu"na sahip olabilirler ya da olmayabilirler