DeepMind, AlphaGo ve AlphaZero’nun özünü açık kaynak olarak yayımladı

xguru · 2023-02-17T14:33:34+09:00

Mctx(MCTS-in-JAX) adlı repo içinde yer alıyor Monte Carlo Tree Search (MCTS) algoritmasını JAX-native olarak uygulayan son derece hızlı bir kütüphane Sıra tabanlı oyunlarda "seçim → genişletme → simülasyon → strateji ağacı düğümlerini güncelleme" yöntemiyle en iyi hamleyi seçen bir arama algoritması AlphaGo’nun en karmaşık bileşeni ve bunu verimli hale getirmek gerçekten çok önemli Yalnızca AlphaGo’da değil, AlphaZero (Go, Chess, Shogi) ve MuZero’da (AlphaZero + Atari oyunları) da kullanılıyor

(twitter.com/DrJimFan)

8 puan yazan xguru 2023-02-17 | 1 yorum | WhatsApp'ta paylaş

Mctx(MCTS-in-JAX) adlı repo içinde yer alıyor
Monte Carlo Tree Search (MCTS) algoritmasını JAX-native olarak uygulayan son derece hızlı bir kütüphane
- Sıra tabanlı oyunlarda "seçim → genişletme → simülasyon → strateji ağacı düğümlerini güncelleme" yöntemiyle en iyi hamleyi seçen bir arama algoritması
AlphaGo’nun en karmaşık bileşeni ve bunu verimli hale getirmek gerçekten çok önemli
Yalnızca AlphaGo’da değil, AlphaZero (Go, Chess, Shogi) ve MuZero’da (AlphaZero + Atari oyunları) da kullanılıyor

1 yorum

xguru 2023-02-17

Bu tweet'i HN'de görmüştüm: https://news.ycombinator.com/item?id=34801636
Aslında bu repo yaklaşık 1 yıldır herkese açık ve bunun AlphaGo'nun tamamı olmadığını, dolayısıyla başlığın clickbait olduğunu eleştiren yorumlar da var.
Ayrıca, AlphaGo'nun asıl implementasyonunun TensorFlow/TPU üzerinde olduğu, bunun ise sadece JAX ile yeniden uygulanmış bir sürüm olduğu da söyleniyor.

DeepMind, AlphaGo ve AlphaZero’nun özünü açık kaynak olarak yayımladı

İlgili okumalar

1 yorum