Satrançta büyükusta seviyesinde, algoritma olmadan
- Bu depo, "Satrançta büyükusta seviyesinde, algoritma olmadan" başlıklı makalenin uygulamasını sunuyor
- Son dönemde makine öğrenmesindeki başarılar başlıca büyük ölçekli attention tabanlı mimariler ve eşi görülmemiş büyüklükte veri kümeleri sayesinde elde edildi
- Bu makale, satranç için büyük ölçekli eğitimin etkisini inceliyor
- Geleneksel satranç motorlarının aksine, karmaşık sezgisel yöntemlere veya açık aramaya dayanmıyor
- 270 milyon parametreli bir transformer modeli, 10 milyon satranç oyunundan oluşan bir veri kümesi üzerinde gözetimli olarak eğitildi
- Stockfish 16 motorunun eylem değerleri kullanılarak her tahta anotlandı ve yaklaşık 15 milyar veri noktası üretildi
- En büyük model, insanlara karşı Lichess blitz Elo 2895 elde ediyor ve açık arama algoritmaları olmadan da zor satranç bulmacalarını çözüyor
- AlphaZero'nun politika ve değer ağlarını (arama olmadan) ve GPT-3.5-turbo-instruct'u geride bırakıyor
- Model ve veri kümesi boyutlarına yönelik sistematik inceleme, güçlü satranç performansının ancak yeterli ölçekte ortaya çıktığını gösteriyor
- Sonuçları doğrulamak için tasarım tercihleri ve hiperparametreler üzerinde kapsamlı deneyler yapıldı
GN⁺ Özeti
- Bu proje, satrançta geleneksel arama algoritmaları olmadan da yüksek performansa ulaşılabileceğini gösteren önemli bir çalışma
- Büyük veri kümeleri ve transformer modelleri kullanarak satranç motorları için yeni olasılıkları araştırıyor
- AlphaZero gibi mevcut güçlü satranç motorlarıyla karşılaştırıldığında daha iyi performans gösteriyor
- Satrançla ilgilenenler için ilgi çekici ve faydalı bilgiler sunarken makine öğrenmesinin yeni uygulama alanlarına da işaret ediyor
- Benzer işlevlere sahip projeler arasında AlphaZero ve Leela Chess Zero bulunuyor
1 yorum
Hacker News görüşleri
İstenen seviyede bir satranç rakibi bulmak zor. Çoğu motor zorluk seviyesini düşürmek için arama derinliğini azaltıyor, ancak bu etkili değil
Bir kullanıcı, satrançla ilgili bilgi damıtımı üzerine bir sunum yaptığını ve satranç gibi standart girdiler için karmaşık doğrusal olmayan arama işlevlerinin yarı doğrusal transformer modellere nasıl damıtılacağını anlattığını belirtiyor
Satranç sinir ağlarıyla ilgilenenler için, PyTorch kullanan kolay kodlar sunan ve mevcut en yüksek performanslı satranç sinir ağlarına benzer bir mimari sağlayan bir GitHub deposu öneriliyor
LC0 ağı ile DeepMind'in transformer ağını karşılaştıran bir blog yazısı var
"Grandmaster-Level Chess Without Search" makalesi, büyük ölçekli attention tabanlı mimarilerin ve veri kümelerinin önemini vurguluyor; satrancı öğrenmek için 270M parametreli bir transformer model kullanıyor
Büyük ölçekli sentetik veri kümeleri, geleneksel arama kullanılarak üretildi; bu da transformer modele arama ağacını kodlamakla aynı anlama geliyor
Matthew Sadler, Leela Zero'yu sezgisel oynayacak şekilde ayarladı; bu da arama olmadan bile eğitim oyunlarını etkili biçimde gerçekleştirebildiğini gösteriyor
Satrancı çözmek çok büyük bir ağaç oluşturuyor ve bunu optimize etmek için iki yaklaşım var
Tahta durumu, FEN dizgileri sabit uzunluklu dizgilere dönüştürülerek kodlanıyor ve hamleleri saklamak için UCI gösterimi kullanılıyor