DeepMind, AlphaGo ve AlphaZero’nun özünü açık kaynak olarak yayımladı
(twitter.com/DrJimFan)Mctx(MCTS-in-JAX)adlı repo içinde yer alıyor- Monte Carlo Tree Search (MCTS) algoritmasını JAX-native olarak uygulayan son derece hızlı bir kütüphane
- Sıra tabanlı oyunlarda "seçim → genişletme → simülasyon → strateji ağacı düğümlerini güncelleme" yöntemiyle en iyi hamleyi seçen bir arama algoritması
- AlphaGo’nun en karmaşık bileşeni ve bunu verimli hale getirmek gerçekten çok önemli
- Yalnızca AlphaGo’da değil, AlphaZero (Go, Chess, Shogi) ve MuZero’da (AlphaZero + Atari oyunları) da kullanılıyor
1 yorum
Bu tweet'i HN'de görmüştüm: https://news.ycombinator.com/item?id=34801636
Aslında bu repo yaklaşık 1 yıldır herkese açık ve bunun AlphaGo'nun tamamı olmadığını, dolayısıyla başlığın clickbait olduğunu eleştiren yorumlar da var.
Ayrıca, AlphaGo'nun asıl implementasyonunun TensorFlow/TPU üzerinde olduğu, bunun ise sadece JAX ile yeniden uygulanmış bir sürüm olduğu da söyleniyor.