MIT 6.S184: Flow Matching ve Diffusion Modellerine Giriş
(diffusion.csail.mit.edu)Flow Matching ve Diffusion Modellerine Giriş
- MIT'nin bilgisayar bilimi dersi 6.S184, olasılıksal diferansiyel denklemleri kullanan üretken yapay zeka üzerine bir derstir.
- Diffusion ve akış tabanlı modeller, görüntü, video, müzik gibi çeşitli veri modalitelerinde üretken yapay zekanın en ileri teknikleri arasında yer almaktadır.
- Bu ders, bu modellerin matematiksel temellerini sıfırdan kurmayı amaçlar; öğrenciler dersin sonunda oyuncak bir görüntü diffusion modeli inşa eder.
- Bu kurs, üretken yapay zekanın teori ve pratiğini ilkeli bir şekilde anlamak isteyen öğrenciler için idealdir.
Ders Notları
- Ders notları, dersin merkezini oluşturur ve tüm materyaller için bağımsız açıklamalar sunar.
- Ders slaytları görsel yardımcı materyal olarak sağlanır; bağımsız materyaller değildir.
Dersler
-
1. ders: Akış ve diffusion modelleri
- Üretken modellere giriş
- Adi ve olasılıksal diferansiyel denklemler
- Akış ve diffusion modellerinde örnekleme
-
2. ders: Eğitim hedeflerinin kurulması
- Koşullu ve marjinal olasılık yolları
- Süreklilik ve Fokker-Planck denklemi
- Marjinal vektör alanları ve marjinal score fonksiyonları
-
3. ders: Akış ve diffusion modellerinin eğitimi
- Flow matching
- Score matching
- Çeşitli diffusion modeli yaklaşımları
-
4. ders: Görüntü üretici oluşturma
- Guidance ve koşullu üretim
- Sinir ağı mimarileri
- En ileri modellerin incelenmesi
-
5. ders: Üretken robotik
- Benjamin Burchfiel'den konuk ders
- Büyük ölçekli davranış modelleri
- Robotik için diffusion modelleri
-
6. ders: Üretken protein tasarımı
- Jason Yim'den konuk ders
- Yapay zeka ile yeni protein tasarımı
- Protein yapısı üretimi için flow matching
Uygulamalar
- Dersle birlikte sunulan 3 uygulama vardır ve adım adım flow matching ile diffusion modelleri kurmayı sağlar.
- Uygulamalar Google Colab üzerinde açılarak yürütülebilir.
Eğitmenler
- Peter ve Ezra dersi birlikte vermekte, Tommi Jaakkola ise sponsor ve danışman olarak görev almaktadır.
- Peter Holderrieth doktora öğrencisidir, Ezra Erives ise mühendislik yüksek lisans öğrencisidir.
Ön Koşullar
- Lineer cebir, reel analiz ve temel olasılık teorisi gereklidir; ayrıca Python ve PyTorch deneyimi olmalıdır.
Not
- Bu ders büyük dil modellerini (LLM) ele almaz. LLM'ler metin gibi ayrık verileri içerir, ancak bu ders görüntü, video ve protein yapıları gibi sürekli uzaydaki verilere odaklanır.
Teşekkür
- Bu ders, çok sayıda kişi ve kuruluşun desteği olmadan mümkün olmazdı.
- Prof. Tommi Jaakkola'ya, MIT EECS'ten Lisa Bella ve Ellen Reid'e ve daha birçok kişiye teşekkür edilir.
1 yorum
Hacker News yorumları
MIT dersi "6.S184: Introduction to Flow Matching and Diffusion Models" YouTube'da yayımlandı
Koşullu normalizing flow, ters tasarım problemleri için en zarif çözümlerden biri
Son 10 yıl, derin öğrenme eğitiminin altın çağıydı
Harika bir ders, bir an önce almak istiyorum
En yeni yapay zeka teknolojileriyle ilgili tüm açık dersleri bir araya getiren bir koleksiyon olup olmadığını merak ediyorum
MIT OCW'ye ve katkıda bulunanlara çok minnettarım
Bu teknoloji çok faydalı olmasına rağmen, LLM'ler sanki dikkatin büyük kısmını başka yöne çekmiş gibi görünüyor
MIT'nin zamanında ve güncel içerikleri ücretsiz sunması harika
Gerçekten teşekkürler, modern yapay zeka hakkında başka OCW dersleri olup olmadığını merak ediyorum
İyi iş, tebrikler