7 puan yazan xguru 2023-07-03 | 1 yorum | WhatsApp'ta paylaş
  • DeepMind'in Flamingo modelinin açık kaynaklı bir uygulaması
  • 3B, 4B ve 9B modelleri yayımlandı
    • MPT-1B/7B ve RedPajama-3B tabanlı
  • Aynı Flamingo model performansının %80'inden fazlasına ulaşıyor
  • Eğitim ve değerlendirme kodları iyileştirildi
    • Fully Sharded Data Parallel (FSDP) desteği
    • Yeni veri setleri (TextVQA, VizWiz, HatefulMemes, Flickr30k) değerlendirme paketine eklendi