LLaVA: Görsel Talimat Ayarlama

xguru · 2023-04-22T10:32:01+09:00

"LLaVA : Large Language and Vision Assistant" Genel amaçlı görsel ve dil anlayışı için bir vision encoder ile Vicuna'yı birleştiren büyük ölçekli çok modlu model Çok modlu GPT-4 düzeyinde yetenekler ve bilimsel soru-cevapta SOTA doğruluğu hedefliyor Makale, kod ve demo yayınlandı

(llava-vl.github.io)

6 puan yazan xguru 2023-04-22 | Henüz yorum yok. | WhatsApp'ta paylaş

"LLaVA : Large Language and Vision Assistant"
Genel amaçlı görsel ve dil anlayışı için bir vision encoder ile Vicuna'yı birleştiren büyük ölçekli çok modlu model
Çok modlu GPT-4 düzeyinde yetenekler ve bilimsel soru-cevapta SOTA doğruluğu hedefliyor
Makale, kod ve demo yayınlandı

LLaVA: Görsel Talimat Ayarlama

İlgili okumalar

Henüz yorum yok.