Öne Çıkanlar
- Araçlar Python, PyData, Pytorch ve Gradient-boosted Decision Tree (GBDT) etrafında yakınsıyor
- Derin öğrenme, tablo biçimli verilerde hâlâ GBDT'nin yerini alamadı
- Transformer'lar NLP'ye liderlik ediyor ve bilgisayarlı görüde Konvolüsyonel Sinir Ağları (CNN) ile rekabet etmeye başlıyor
- Yarışmalar; bilgisayarlı görü, NLP, tablo biçimli veri, robotik ve zaman serisi analizi dâhil çeşitli araştırma alanlarını kapsıyor
- Tek model çözümleri bazen kazansa da, büyük ölçekli ensemble'lar genellikle kazanıyor
- Birden fazla makine öğrenimi yarışma platformu var ve ayrıca her yarışma için oluşturulmuş onlarca site bulunuyor
- Rekabetçi makine öğrenimi, akademi dâhil olmak üzere popülerliğini artırmaya devam ediyor
- Kazananların %50'si tek başına yarışan kişiler ve kazananların %50'si ilk kez kazananlar. %30'u ise daha önce iki veya daha fazla kez kazanmış
- Bazı yarışmacılar çözümlerini eğitmek için donanıma ciddi yatırım yapabilse de, Google Colab gibi ücretsiz donanım kullanan yarışmacılar da hâlâ kazanabiliyor
Rekabetçi ML Ekosistemi
- Dikkat Çeken Yarışmalar ve Eğilimler
- Ödül miktarı açısından en büyüğü DrivenData'nın Snowcast Showdown yarışmasıydı (ABD İskân ve Kentsel Gelişim Bakanlığı sponsorluğunda). $500k ödül
- En popüler yarışma Kaggle'ın American Express Default Prediction yarışmasıydı. 4000'den fazla takım katıldı. $100k ödül. Birincilik, ilk kez katılan tek bir yarışmacıya gitti (neural net + LightGBM)
- En büyük bağımsız yarışma Stanford'un AI Audit Challenge yarışmasıydı
- En büyük alan bilgisayarlı görüydü: çevre, tıp
- İkinci en büyük alan NLP idi: NLP + arama, NLP + Reinforcement Learning
- Sequential Decision-Making alanı da büyüyor
- Platformlar
- Kaggle > Tianchi > Codalab > Zindi > AICrowd > DrivenData > ,..
- Diğer ilgi çekici platformlar: Numerai, Markridakis Open Forecasting Center, Microprediction, OpenML, CodaBench,..
- Amaç
- İyi yönetilen yarışmalar
- Çözmek isteyeceğiniz ilginç bir problemi eğitim verisiyle birlikte sunar
- Yetenekli potansiyel katılımcılardan oluşan bir havuz sağlar
- Overfitting yapan katılımcıları cezalandıran mekanizmalar içerir
- Katılımcıların problem çözmeye gerçek çaba harcamasını sağlayacak kadar yeterli (finansal) teşvik sunar
- Kazanan çözümler için kamuya açık inceleme sağlar (yarışma bittikten sonra)
Kazanan Çözümler
- Kazanan araç seti: Python, ikinci sırada C++
- En çok kullanılan Python paketleri
- PyData: Numpy, Pandas, SciPy, Scikit Learn
- Deep Learning: PyTorch
- GBDT: LightGBM, XGBoost, CatBoost
- Hyperparameter Optimisation: Optuna
- Experiment Tracking: W&B
- Visualiation: matplotlib, seaborn
- NLP Toolkit: Tranformers
- Computer Vision Toolkit: Albumentations, OpenCV, pillow, scikit-image, timm
Henüz yorum yok.