Ilya Sutskever: "Bunların hepsini öğrenirseniz önemli şeylerin %90’ını bilmiş olursunuz"
(reddit.com)Ilya Sutskever’in makine öğrenimi/yapay zeka ile ilgili önerdiği okuma listesi
- The Annotated Transformer
- The First Law of Complexodynamics
- The Unreasonable Effectiveness of RNNs
- Understanding LSTM Networks
- Recurrent Neural Network Regularization
- Keeping Neural Networks Simple by Minimizing the Description Length of the Weights
- Pointer Networks
- ImageNet Classification with Deep CNNs
- Order Matters: Sequence to sequence for sets
- GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
- Deep Residual Learning for Image Recognition
- Multi-Scale Context Aggregation by Dilated Convolutions
- Neural Quantum Chemistry
- Attention Is All You Need
- Neural Machine Translation by Jointly Learning to Align and Translate
- Identity Mappings in Deep Residual Networks
- A Simple NN Module for Relational Reasoning
- Variational Lossy Autoencoder
- Relational RNNs
- Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton
- Neural Turing Machines
- Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
- Scaling Laws for Neural LMs
- A Tutorial Introduction to the Minimum Description Length Principle
- Machine Super Intelligence Dissertation
-
- sayfadan itibaren: Komogrov Complexity
- CS231n Convolutional Neural Networks for Visual Recognition
Bağlantı derlemesi: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
3 yorum
Neo bot crawling ile ilgili bir sorun var gibi görünüyor.
Görünüşe göre Reddit engelliyor. Ben de elle ekledim ;)
Hacker News görüşü
Hacker News yorumları derleme özeti
Başlık, bu görevin kapsamını olduğundan küçük gösteriyor. İçeriğe girip bunların ne olduğuna bakarsanız:
Bir süre önce ben de listedekileri link adresine kopyaladım, böylece
wgetile almak daha kolay oldu (örneğin tüm arXiv PDF’lerini)wgetkomutunu kullanarak tüm arXiv PDF’leri indirilebilir.pdfunitekullanarak bunları tek bir PDF’de birleştirdik ve matbaada spiral cilt olarak bastırdık. Sonuç gerçekten çok iyiydi.Bunun gerçek liste olduğuna dair doğrulanmış bir bilgi olmadığını akılda tutun.
Zaten bir bilgisayar bilimi geçmişiniz yoksa, bunları öğrenmek için gereken ön koşulları öğrenmek ne kadar sürer?
İnsanların unuttuğu şey şu: Uygun ve somut bir hedef olmadan, ne kadar temel ya da ilginç makale okursanız okuyun, yine de hiçbir şey hatırlamayacaksınız.
Ekim 2022’ye kadar giden birkaç eski tartışma var. Listenin şimdi ne kadar güncelliğini yitirdiğini merak ediyorum.
Bu sadece birinin yer imi klasörü. Bunların Ilya tarafından önerildiğine dair kanıt nerede?
Bunun ML’de önemli olan şeylerin %90’ı olduğu iddiası biraz iddialı görünüyor.
Burada LLM’lerle ilgili hiçbir şey yok; oysa in-context learning, retrieval augmentation, tool use ve multimodality asıl hızlı ilerlemenin yaşandığı alanlar.
30 çalışmayı okumak, "öğrendim ve anladım" anlamına gelmez. Özellikle sıfırdan başlıyorsanız.