- Segment Anything Model 2, görsellerde ve videolarda istemle yönlendirilebilen görsel segmentasyon problemini çözmek için geliştirilmiş bir modeldir
- Görselleri tek karelik video olarak ele alarak videoya genişletir
- Gerçek zamanlı video işleme için akış belleğine sahip basit bir transformer mimarisi kullanır
- Kullanıcı etkileşimi yoluyla modeli ve veriyi iyileştiren bir veri motoru kurarak SA-V veri kümesini topladı
- Çeşitli görevlerde ve görsel alanlarda güçlü performans sunar
- Segment Anything Video (SA-V) veri kümesi de yayımlandı
- 50.583 farklı videodan ve 642.036 yüksek kaliteli uzamsal-zamansal segmentasyon maskesinden (Masklet) oluşur
- CC by 4.0 lisansı
2 yorum
Segment Anything Model(SAM): Meta'nın görüntülerdeki herhangi bir nesneyi çıkarmayı sağlayan yapay zeka modeli
SAM.cpp - Meta'nın Segment Anything Model'inin saf C/C++ ile gerçekleştirilmiş sürümü
Hacker News yorumları
mIoU ve görüntü işleme hızındaki 6 kat artış ilgimi çekti
Segment Anything ekibi SAM 2 modelini yayınladı
Daha önce SAM 1 ile ilgilenmiştim
Video karelerini sınıflandıran ve belirli kareleri bulan bir model eğitmek istiyorum
SAM kayıp fonksiyonunun büyük hayranıyım
Web demosu çok temiz görünüyor
İlk SAM modeli en faydalı olanıydı
Araştırma demosu Illinois ve Texas eyaletlerinde kullanılamıyor
Askeri kullanıma dair endişeler var
Etkileyici bir başarı