Leela Chess Zero'nun sınırları
- Leela Chess Zero, kendi kendine oynadığı maçlarla milyarlarca kez eğitim görerek dünya şampiyonu oldu
- Ancak Stockfish'e karşı ezici biçimde yenildi
- Daha büyük ağlar eğitilse bile Stockfish'i yenemedi
- Stockfish, Leela'dan çok daha küçük bir model kullanmasına rağmen daha iyi arama yeteneği sayesinde kazandı
Stockfish'in zaferi üzerine daha fazla düşünce
- Leela, aramada yeterince iyi olmadığı için dünya şampiyonluğunu kaybetti
- LLM'lere arama yeteneği eklemek artık çok yakın, ancak yeterince ilgi görmüyor
- GPT-4 gibi foundation modellerin arama yeteneği yok
- Aramayı mümkün kılmak için daha büyük modellere ihtiyaç olduğu varsayımı baskın, ancak buna karşı örnekler var
- DeepMind'ın araştırmasına göre satranç algoritmalarında arama davranışı doğal olarak ortaya çıkıyor
- Verimli arama algoritmaları varken, büyük modellerde verimsiz bir öncül aramanın tesadüfen ortaya çıkmasını beklemeye gerek yok
- Günümüz modelleri aramayı mümkün kılacak kadar büyük ve hatta gereksiz derecede büyük olabilir
Arama, hedef alana hesaplama kaynaklarının tahsis edilmesini mümkün kılar
- Bir ilaç şirketinin yapay zekayı kullanarak yeni ilaç araştırmak istediğini varsayalım
- Yapay zeka aramasının mümkün olduğu bir dünyada iki seçenek vardır
- 2030'a kadar bekleyip OpenAI'ın 4 büyüklük mertebesi daha büyük bir model çıkarmasını beklemek veya
- Bugün hemen 4 büyüklük mertebesi daha fazla çıkarım hesaplama kaynağı kullanmak
- İlaç şirketi ikinci seçeneği tercih edecektir
- Arama sayesinde 2030'daki ASI düzeyi yeteneklerden bugünden yararlanmak mümkün olur
Arama tabanlı yapay zeka gelişim senaryosu
- Mevcut modellerde aramanın çalıştığı keşfedilir
- Hükümetler veya büyük araştırma kurumları, aramanın yapay zeka araştırmalarına ya da yurt dışı istihbarat toplamaya hemen uygulanabileceğini fark eder
- Çıkarım hesaplama kaynakları sınırlı olduğu için bu kullanım hükümetler veya büyük araştırma kurumları tarafından güvenlik ya da yapay zeka araştırmasıyla sınırlı kalır
- Arama öncülüğündeki yapay zeka gelişimi, daha verimli arama algoritmalarının ve model mimarilerinin keşfine yol açar
- Arama daha fazla eğitim verisi gerektirmez; böylece 'veri duvarı' sorunu hafifler
- Zeka patlaması 2030'da değil, gelecek yıldan itibaren başlar
Aramanın yapay zekanın kendi araştırmasına uygulanma olasılığı
- Yapay zeka kendisini araştırabilecek kadar geliştiğinde, çok hızlı bir ilerleme dinamiği beklenir
- Bir ilaç şirketi GPT-8'i beklemeden yeni ilaç araştırabildiği gibi, yapay zeka laboratuvarları da daha büyük modelleri beklemeden yapay zekayı araştırabilir hale gelir
- İnsan yapay zeka araştırmacılarının yerini alabilmesi için daha fazla kısıtın kaldırılması gerekebilir
- Ancak GPT-8 düzeyinde zekaya sahip basit bir chatbot bile yapay zeka gelişimini hızlandırmak için yeterli olabilir
1 yorum
Hacker News görüşü
Hacker News yorum özeti