Convolution İmparatorluğu'nun Geri Dönüşü

xguru · 2023-10-31T10:03:01+09:00

"ConvNets Match Vision Transformers at Scale" ConvNet'lerin orta ve küçük ölçekli veri setlerinde iyi performans gösterdiği, ancak çok büyük veri setlerinde transformer'ların, özellikle de Vision Transformer'ların (ViT), gerisinde kaldığı yönünde yaygın bir kanı var DeepMind'ın son araştırması bu görüşe meydan okuyor Transformer'ların ölçeklenebilirliğinin ConvNet'lerin ölçeklenebilirliğini aştığı düşünülüyordu, ancak bunu destekleyen kanıtlar yetersiz Yazarlar, ağın genişliğini/derinliğini kademeli olarak artırmak için NFNet (Normalizer-Free ResNets) ailesini kullandı JFT-4B üzerinde ön eğitim yapıp, ImageNet'te ince ayar için SAM (Sharpness-Aware Minimization) kullandılar Sonuç olarak ViT modelleriyle eşdeğer performans gösterdiler Tüm modeller, ek hesaplama gücü verildikçe sürekli olarak iyileşti

(gonzoml.substack.com)

6 puan yazan xguru 2023-10-31 | Henüz yorum yok. | WhatsApp'ta paylaş

"ConvNets Match Vision Transformers at Scale"
ConvNet'lerin orta ve küçük ölçekli veri setlerinde iyi performans gösterdiği, ancak çok büyük veri setlerinde transformer'ların, özellikle de Vision Transformer'ların (ViT), gerisinde kaldığı yönünde yaygın bir kanı var
DeepMind'ın son araştırması bu görüşe meydan okuyor
- Transformer'ların ölçeklenebilirliğinin ConvNet'lerin ölçeklenebilirliğini aştığı düşünülüyordu, ancak bunu destekleyen kanıtlar yetersiz
- Yazarlar, ağın genişliğini/derinliğini kademeli olarak artırmak için NFNet (Normalizer-Free ResNets) ailesini kullandı
- JFT-4B üzerinde ön eğitim yapıp, ImageNet'te ince ayar için SAM (Sharpness-Aware Minimization) kullandılar
- Sonuç olarak ViT modelleriyle eşdeğer performans gösterdiler
- Tüm modeller, ek hesaplama gücü verildikçe sürekli olarak iyileşti

Convolution İmparatorluğu'nun Geri Dönüşü

İlgili okumalar

Henüz yorum yok.