"Open Pre-trained Transformer Language Model"
- Bu tür büyük ölçekli dil modellerini oluşturmak ciddi sermaye gerektirir ve yalnızca API erişimi sunulduğunda araştırma yapmak zordur
- İlgilenen araştırmacılar için modelin tamamı, deneysel kodlar ve logbook indirilebilir şekilde yayımlandı
- GPT-3'e kıyasla karbon ayak izi yalnızca 1/7 düzeyinde
1 yorum
https://github.com/facebookresearch/metaseq