- Büyük dil modellerinin (LLM'ler) yarattığı gürültü arasında makine öğrenimi (ML) ve veri bilimi tarafında da birçok ilginç gelişme yaşanıyor
- Cynthia Rudin, açıklanabilir yapay zeka üzerine güçlü araştırmalar yayımlamayı sürdürüyor
- Son birkaç aydaki ilgi çekici projeler:
- NeRF'lere dair açıklama:
- Dokulu çokgenler yerleştirmek yerine parlayan yarı saydam küreler kullanarak 3B grafikleri temelden yeniden düşünme yaklaşımı
- Kürelerin konumu ve rengi, hassas çok açılı kamera çekimleri ve pozlar aracılığıyla sinir ağı tarafından öğreniliyor; ardından GPU üzerinde ray tracing ile render edilebiliyor
- Sahneler fotoğraflardan üretildiği için tamamen gerçekçi, ama aynı zamanda keşfedilebilir
- Teorik olarak bu tür sahneler canlandırılabilir, ancak bunun pratikte nasıl yapılacağı hâlâ bir araştırma konusu
- Nanite+photogrammetry gibi optimize edilmiş çokgen tabanlı sistemlerden daha iyi olup olmayacağı belirsiz
- Araçtan yol videosu çekerek 3B sahne oluşturabilecek araçlara dair soru:
- Yol kenarı manzarasına odaklanmak isteniyor; farklı açılardan birden çok kez sürüş yapılabilir ve işlem süresinin uzun olması sorun değil
- Bir yarış simülatöründe kullanmak üzere yerel yollar üretmek amaçlanıyor
- Geometrik derin öğrenmeye ilgi:
- Veride bilinen simetrilere saygı gösterecek şekilde modelleri ilkesel olarak tasarlama yöntemi
- ConvNet'ler dönüşüm eşdeğerlilikleriyle biliniyor, ancak başka simetri grupları için de yakın dönem örnekler var
- Belirli simetrilerin otomatik olarak keşfedilip keşfedilemeyeceği ya da tanımlanıp tanımlanamayacağı da soruluyor
- UW-Madison'daki ML+X topluluğunun düzenlediği makine öğrenimi maratonu tanıtımı:
- Kaggle'da yarışma olarak öne çıkarılacak yaklaşık 12 haftalık bir yaz etkinliği
- Makine öğrenimi araçlarını birlikte öğrenip uygulayarak gerçek veri kümeleri için yenilikçi çözümler bulma fırsatı
- Çeşitli zorluklar içeriyor ve hem yeni başlayanlar hem de ileri düzey uygulayıcılar için uygun
- Katılımcılar, proje danışmanları ve etkinlik organizatörleri haftalık veya iki haftada bir buluşarak ipuçları paylaşıyor ve kısa demo/tartışmalar yapıyor
- Becerileri geliştirme ve topluluk oluşturmanın içsel ödüllerinin yanı sıra kazanan takımlara nakit ödül veriliyor
- LLM'lerin kuzeni sayılabilecek Vision-Language-Action (VLA) modeli RT-2 tanıtımı:
- Metin ve görsel verinin yanı sıra robot hareket verisini de "bir başka dil" olarak dahil ediyor ve bunu robotun hareketlerini üreten token'lar olarak kullanıyor
- SAM ailesindeki bilgisayarlı görü modellerinin, birçok insan anotasyon hizmeti ve aracını kısmen gereksiz hâle getirdiği görüşü:
- Görsel verinin otomatik etiketlenmesi görece yüksek kaliteyle yapılabiliyor
- ArXiv'de ilgi duyulan belirli konulardaki en güncel araştırmaları almak için Scholars.io hizmetini başlatma deneyimi paylaşılmış:
- İlgilenilmeyen araştırmaları filtreleyebildiği için başkalarının LLM dışındaki araştırma faaliyetlerini bulmasına yardımcı olmasının umulduğu belirtiliyor
- 2024'te de ML öğrenmeye devam etmenin değerli olup olmadığına dair soru ve kişisel sezgiden söz ediliyor:
- xgboost kullanılan yan projelerde çalışıldığı deneyimi paylaşılıyor
- ML'nin hâlâ değerli olduğu hissediliyor, ancak bundan tam emin olunamıyor
Henüz yorum yok.