Ask HN: LLM gürültüsünde kaybolmayan ML alanındaki eğilimler neler?

(news.ycombinator.com)

19 puan yazan GN⁺ 2024-03-29 | Henüz yorum yok. | WhatsApp'ta paylaş

Büyük dil modellerinin (LLM'ler) yarattığı gürültü arasında makine öğrenimi (ML) ve veri bilimi tarafında da birçok ilginç gelişme yaşanıyor
Cynthia Rudin, açıklanabilir yapay zeka üzerine güçlü araştırmalar yayımlamayı sürdürüyor
Son birkaç aydaki ilgi çekici projeler:
- Birkaç görüntüden 3B sahne yeniden oluşturma: NAVER LABS Europe
- Gaussian avatarlar: Gaussian Avatars
- Yeniden aydınlatılabilir Gaussian codec: Relightable Gaussian Codec
- Her şeyi takip etme: Co-Tracker, Omnimotion
- Her şeyi segmentlere ayırma: Facebook Research'ün Segment Anything'i
- Başarılı insan pozu tahmini modelleri: Yolov8, Google'ın MediaPipe modelleri
- Gerçekçi TTS: Hugging Face üzerinde Coqui'nin XTTS-v2'si, Bark TTS
- Güçlü STT: çoğunlukla Whisper tabanlı
- Makine çevirisi: örneğin Meta'nın SeamlessM4T modeli
- Meta'nın Ar-Ge çalışmalarından çıkan çok sayıdaki sonuca duyulan hayranlık
NeRF'lere dair açıklama:
- Dokulu çokgenler yerleştirmek yerine parlayan yarı saydam küreler kullanarak 3B grafikleri temelden yeniden düşünme yaklaşımı
- Kürelerin konumu ve rengi, hassas çok açılı kamera çekimleri ve pozlar aracılığıyla sinir ağı tarafından öğreniliyor; ardından GPU üzerinde ray tracing ile render edilebiliyor
- Sahneler fotoğraflardan üretildiği için tamamen gerçekçi, ama aynı zamanda keşfedilebilir
- Teorik olarak bu tür sahneler canlandırılabilir, ancak bunun pratikte nasıl yapılacağı hâlâ bir araştırma konusu
- Nanite+photogrammetry gibi optimize edilmiş çokgen tabanlı sistemlerden daha iyi olup olmayacağı belirsiz
Araçtan yol videosu çekerek 3B sahne oluşturabilecek araçlara dair soru:
- Yol kenarı manzarasına odaklanmak isteniyor; farklı açılardan birden çok kez sürüş yapılabilir ve işlem süresinin uzun olması sorun değil
- Bir yarış simülatöründe kullanmak üzere yerel yollar üretmek amaçlanıyor
Reklam
Geometrik derin öğrenmeye ilgi:
- Veride bilinen simetrilere saygı gösterecek şekilde modelleri ilkesel olarak tasarlama yöntemi
- ConvNet'ler dönüşüm eşdeğerlilikleriyle biliniyor, ancak başka simetri grupları için de yakın dönem örnekler var
- Belirli simetrilerin otomatik olarak keşfedilip keşfedilemeyeceği ya da tanımlanıp tanımlanamayacağı da soruluyor
UW-Madison'daki ML+X topluluğunun düzenlediği makine öğrenimi maratonu tanıtımı:
- Kaggle'da yarışma olarak öne çıkarılacak yaklaşık 12 haftalık bir yaz etkinliği
- Makine öğrenimi araçlarını birlikte öğrenip uygulayarak gerçek veri kümeleri için yenilikçi çözümler bulma fırsatı
- Çeşitli zorluklar içeriyor ve hem yeni başlayanlar hem de ileri düzey uygulayıcılar için uygun
- Katılımcılar, proje danışmanları ve etkinlik organizatörleri haftalık veya iki haftada bir buluşarak ipuçları paylaşıyor ve kısa demo/tartışmalar yapıyor
- Becerileri geliştirme ve topluluk oluşturmanın içsel ödüllerinin yanı sıra kazanan takımlara nakit ödül veriliyor
LLM'lerin kuzeni sayılabilecek Vision-Language-Action (VLA) modeli RT-2 tanıtımı:
- Metin ve görsel verinin yanı sıra robot hareket verisini de "bir başka dil" olarak dahil ediyor ve bunu robotun hareketlerini üreten token'lar olarak kullanıyor
SAM ailesindeki bilgisayarlı görü modellerinin, birçok insan anotasyon hizmeti ve aracını kısmen gereksiz hâle getirdiği görüşü:
- Görsel verinin otomatik etiketlenmesi görece yüksek kaliteyle yapılabiliyor
Reklam
ArXiv'de ilgi duyulan belirli konulardaki en güncel araştırmaları almak için Scholars.io hizmetini başlatma deneyimi paylaşılmış:
- İlgilenilmeyen araştırmaları filtreleyebildiği için başkalarının LLM dışındaki araştırma faaliyetlerini bulmasına yardımcı olmasının umulduğu belirtiliyor
2024'te de ML öğrenmeye devam etmenin değerli olup olmadığına dair soru ve kişisel sezgiden söz ediliyor:
- xgboost kullanılan yan projelerde çalışıldığı deneyimi paylaşılıyor
- ML'nin hâlâ değerli olduğu hissediliyor, ancak bundan tam emin olunamıyor

Ask HN: LLM gürültüsünde kaybolmayan ML alanındaki eğilimler neler?

İlgili okumalar

Henüz yorum yok.