Sıfırdan LLM Kurmak: 3 Saatlik Kodlama Atölyesi
(magazine.sebastianraschka.com)- Hafta sonunda birkaç saat ayırarak büyük dil modellerini (LLM) anlamak isteyenler için, uygulama, eğitim ve kullanım konularını ele alan 3 saatlik bir kodlama atölyesi sunumu hazırlanmış
- Aşağıda videoda ele alınan içerikleri gösteren içindekiler yer alıyor (videonun kendisinde, ilgilendiğiniz konuya doğrudan geçebileceğiniz tıklanabilir bölüm işaretleri bulunuyor)
İçindekiler
-
0:00 – Atölye özeti
-
2:17 – Part 1: LLM’e giriş
-
9:14 – Atölye materyalleri
-
10:48 – Part 2: LLM girdi verisini anlamak
-
23:25 – Basit bir tokenizer sınıfı
-
41:03 – Part 3: LLM mimarisini kodlamak
-
45:01 – GPT-2 ve Llama 2
-
1:07:11 – Part 4: Ön eğitim
-
1:29:37 – Part 5.1: Önceden eğitilmiş ağırlıkları yükleme
-
1:45:12 – Part 5.2: LitGPT ile önceden eğitilmiş ağırlıklar
-
1:53:09 – Part 6.1: Talimat ince ayarı
-
2:08:21 – Part 6.2: LitGPT ile talimat ince ayarı
-
2:26:45 – Part 6.3: Benchmark değerlendirmesi
-
2:36:55 – Part 6.4: Diyalog performansı değerlendirmesi
-
2:42:40 – Sonuç
-
Her zamanki metin tabanlı içeriklerden biraz farklı olsa da, birkaç ay önce yapıldığında çok iyi geri dönüş aldığı için bunu bir kez daha paylaşmanın iyi olacağı düşünülmüş
-
İyi seyirler!
Referans materyaller
- Build an LLM from Scratch kitabı
- Build an LLM from Scratch GitHub deposu
- Atölye kodlarını içeren GitHub deposu
- Bu atölye için Lightning Studio
- LitGPT GitHub deposu
Ahead of AI aboneliği
- Sebastian Raschka'nın 2 yıl önce başlattığı bir proje
- Ahead AI, makine öğrenimi ve yapay zeka araştırmalarına odaklanıyor; sürekli değişen bu alanda önde kalmak isteyen on binlerce araştırmacı ve uygulayıcı tarafından okunuyor
GN⁺ Özeti
- Bu atölye, LLM’leri sıfırdan uygulamayı ve eğitmeyi öğrenmek isteyenler için oldukça faydalı
- GPT-2 ve Llama 2 gibi modelleri ele alıyor; önceden eğitilmiş ağırlıkların nasıl yükleneceğini ve talimat ince ayarının nasıl yapılacağını açıklıyor
- Makine öğrenimi ve yapay zeka araştırmalarına ilgi duyanlar için oldukça ilgi çekici ve faydalı olabilir
- Benzer işlevlere sahip diğer projeler arasında Hugging Face'in Transformers kütüphanesi ve OpenAI'ın GPT modelleri bulunuyor
1 yorum
Hacker News görüşleri
"Temellere geri dönmek her zaman iyidir" görüşüyle birlikte paylaşım için teşekkür edilmiş
"Cahilliğim için kusura bakmayın ama bunun Andrej Karpathy’nin https://www.youtube.com/watch?v=kCc8FmEb1nY videosundan farklı olup olmadığını merak ediyorum" diye sorulmuş
"Sebastian’ın yazıları güzel" görüşüyle birlikte kitabın beklendiği belirtilmiş