8 puan yazan xguru 2023-02-17 | 1 yorum | WhatsApp'ta paylaş
  • Mctx(MCTS-in-JAX) adlı repo içinde yer alıyor
  • Monte Carlo Tree Search (MCTS) algoritmasını JAX-native olarak uygulayan son derece hızlı bir kütüphane
    • Sıra tabanlı oyunlarda "seçim → genişletme → simülasyon → strateji ağacı düğümlerini güncelleme" yöntemiyle en iyi hamleyi seçen bir arama algoritması
  • AlphaGo’nun en karmaşık bileşeni ve bunu verimli hale getirmek gerçekten çok önemli
  • Yalnızca AlphaGo’da değil, AlphaZero (Go, Chess, Shogi) ve MuZero’da (AlphaZero + Atari oyunları) da kullanılıyor

1 yorum

 
xguru 2023-02-17

Bu tweet'i HN'de görmüştüm: https://news.ycombinator.com/item?id=34801636
Aslında bu repo yaklaşık 1 yıldır herkese açık ve bunun AlphaGo'nun tamamı olmadığını, dolayısıyla başlığın clickbait olduğunu eleştiren yorumlar da var.
Ayrıca, AlphaGo'nun asıl implementasyonunun TensorFlow/TPU üzerinde olduğu, bunun ise sadece JAX ile yeniden uygulanmış bir sürüm olduğu da söyleniyor.