2 puan yazan GN⁺ 2024-10-19 | 1 yorum | WhatsApp'ta paylaş

Satrançta büyükusta seviyesinde, algoritma olmadan

  • Bu depo, "Satrançta büyükusta seviyesinde, algoritma olmadan" başlıklı makalenin uygulamasını sunuyor
  • Son dönemde makine öğrenmesindeki başarılar başlıca büyük ölçekli attention tabanlı mimariler ve eşi görülmemiş büyüklükte veri kümeleri sayesinde elde edildi
  • Bu makale, satranç için büyük ölçekli eğitimin etkisini inceliyor
  • Geleneksel satranç motorlarının aksine, karmaşık sezgisel yöntemlere veya açık aramaya dayanmıyor
  • 270 milyon parametreli bir transformer modeli, 10 milyon satranç oyunundan oluşan bir veri kümesi üzerinde gözetimli olarak eğitildi
  • Stockfish 16 motorunun eylem değerleri kullanılarak her tahta anotlandı ve yaklaşık 15 milyar veri noktası üretildi
  • En büyük model, insanlara karşı Lichess blitz Elo 2895 elde ediyor ve açık arama algoritmaları olmadan da zor satranç bulmacalarını çözüyor
  • AlphaZero'nun politika ve değer ağlarını (arama olmadan) ve GPT-3.5-turbo-instruct'u geride bırakıyor
  • Model ve veri kümesi boyutlarına yönelik sistematik inceleme, güçlü satranç performansının ancak yeterli ölçekte ortaya çıktığını gösteriyor
  • Sonuçları doğrulamak için tasarım tercihleri ve hiperparametreler üzerinde kapsamlı deneyler yapıldı

GN⁺ Özeti

  • Bu proje, satrançta geleneksel arama algoritmaları olmadan da yüksek performansa ulaşılabileceğini gösteren önemli bir çalışma
  • Büyük veri kümeleri ve transformer modelleri kullanarak satranç motorları için yeni olasılıkları araştırıyor
  • AlphaZero gibi mevcut güçlü satranç motorlarıyla karşılaştırıldığında daha iyi performans gösteriyor
  • Satrançla ilgilenenler için ilgi çekici ve faydalı bilgiler sunarken makine öğrenmesinin yeni uygulama alanlarına da işaret ediyor
  • Benzer işlevlere sahip projeler arasında AlphaZero ve Leela Chess Zero bulunuyor

1 yorum

 
GN⁺ 2024-10-19
Hacker News görüşleri
  • İstenen seviyede bir satranç rakibi bulmak zor. Çoğu motor zorluk seviyesini düşürmek için arama derinliğini azaltıyor, ancak bu etkili değil

    • Kullanıcılar, insan oyuncu gibi hissettiren bilgisayar rakipleri istiyor
  • Bir kullanıcı, satrançla ilgili bilgi damıtımı üzerine bir sunum yaptığını ve satranç gibi standart girdiler için karmaşık doğrusal olmayan arama işlevlerinin yarı doğrusal transformer modellere nasıl damıtılacağını anlattığını belirtiyor

  • Satranç sinir ağlarıyla ilgilenenler için, PyTorch kullanan kolay kodlar sunan ve mevcut en yüksek performanslı satranç sinir ağlarına benzer bir mimari sağlayan bir GitHub deposu öneriliyor

  • LC0 ağı ile DeepMind'in transformer ağını karşılaştıran bir blog yazısı var

  • "Grandmaster-Level Chess Without Search" makalesi, büyük ölçekli attention tabanlı mimarilerin ve veri kümelerinin önemini vurguluyor; satrancı öğrenmek için 270M parametreli bir transformer model kullanıyor

    • Stockfish 16 motoru kullanılarak 1 milyardan fazla veri noktası üretildi ve insanlara karşı Lichess blitz Elo 2895'e ulaşıldı
    • AlphaZero'nun politika ve değer ağlarını geride bırakıyor
  • Büyük ölçekli sentetik veri kümeleri, geleneksel arama kullanılarak üretildi; bu da transformer modele arama ağacını kodlamakla aynı anlama geliyor

  • Matthew Sadler, Leela Zero'yu sezgisel oynayacak şekilde ayarladı; bu da arama olmadan bile eğitim oyunlarını etkili biçimde gerçekleştirebildiğini gösteriyor

  • Satrancı çözmek çok büyük bir ağaç oluşturuyor ve bunu optimize etmek için iki yaklaşım var

    • Ağacı yaklaşık olarak modellemek ve açıklamaları yaklaşık olarak modellemek
    • 270M kelimelik verilerle ağaç yaklaşık olarak modellenebilir
  • Tahta durumu, FEN dizgileri sabit uzunluklu dizgilere dönüştürülerek kodlanıyor ve hamleleri saklamak için UCI gösterimi kullanılıyor

    • Her problem varyasyonu için tokenizer'ı yeniden yazmak gerekiyorsa, bu yalnızca basit bir programlamadır