- Yaklaşık 740 milyon görüntü-metin çifti ve bunlara ek birçok özelliği içeren büyük ölçekli bir eğitim veri kümesi
- HTML belgelerindeki görseller ile
alt özelliği (HTML'de görsel ekranda gösterilemediğinde görünen metin) toplandı
- Benzer diğer veri kümelerini tamamlayarak büyük ölçekli temel modellerin eğitilmesinde kullanılmasının beklendiği belirtiliyor
- ‘COYO’, daha önce tanıtılan ultra büyük yapay zeka görüntü üretim modeli ‘RQ-Transformer’ ve yapay zeka sanatçısı ‘Karlo’nun geliştirilmesinde kullanıldı
- Veri toplama sürecinin ayrıntıları daha sonra yayımlanacak bir makalede paylaşılacak
1 yorum
COYO-700M: Görsel-Metin Çifti Veri Kümesi
Kakao Brain, küresel ölçekte en üst düzey veri kümelerinden biri olan ‘COYO’yu yayımladı