3 puan yazan xguru 2023-05-31 | 3 yorum | WhatsApp'ta paylaş
  • Vizyon, ses ve dil modalitelerinin tamamını kapsayan bir General Representation Model
  • Önceden eğitilmiş modeller olmadan da birleşik görevlerde mükemmel sonuçlar üretiyor
  • Güçlü bir Emergent Zero-shot Retrieval sayesinde eğitim verisinde eşleştirilmemiş modaliteleri hizalayabiliyor
  • Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

3 yorum

 
ninebow 2023-05-31

Ah, sanırım bu geçen hafta paylaştığınızla aynı. +_+
https://tr.news.hada.io/topic?id=9249

 
xguru 2023-05-31

Ah, yanlış bir şeyi kopyalamışım huhu Slack'te de paylaşıldığı için olduğu gibi bırakacağım
(Önemli bir şey olduğu için iki kez bakmış olun.. huhu)

 
ninebow 2023-05-31

Evet, teşekkürler! 🙇🏼‍♂️
(Sayenizde bunun xguru’nun bizzat paylaştığı bir gönderi olduğunu öğrenmiş oldum! 🤣)