- WebGPU desteği (WASM'den 100 kata kadar daha hızlı)
- Yeni nicemleme formatları
dtypes
- 120 mimari desteği
- 25 yeni örnek proje ve şablon
- 1200'den fazla önceden dönüştürülmüş model
- Node.js (ESM + CJS), Deno ve Bun uyumluluğu
WebGPU desteği
- WebGPU, hızlandırılmış grafikler ve hesaplama için yeni bir web standardıdır
- Geliştiricilerin tarayıcıdan doğrudan sistemin GPU'sunu kullanarak yüksek performanslı hesaplama yapmasını sağlar
- WebGL'in halefi olarak, modern GPU'larla daha doğrudan etkileşim kurabildiği için performansı büyük ölçüde artırır
- Ayrıca genel amaçlı GPU hesaplamayı desteklediğinden makine öğrenimi için uygundur
- Ekim 2024 itibarıyla dünya genelinde WebGPU destek oranı yaklaşık %70 seviyesindedir
- Tarayıcıya bağlı olarak WebGPU'yu etkinleştirmek için özellik bayrakları kullanmanız gerekebilir
- Transformers.js v3'te WebGPU kullanımı
- ONNX Runtime Web ile yapılan iş birliği sayesinde, model yüklerken yalnızca
device: 'webgpu' ayarlayarak WebGPU hızlandırmasını etkinleştirebilirsiniz
- Metin gömme hesaplama, konuşma tanıma, görüntü sınıflandırma gibi işler için WebGPU kullanılabilir
Yeni nicemleme formatları (dtypes)
- Transformers.js v3 öncesinde,
quantized seçeneğiyle quantized (q8) veya tam hassasiyetli (fp32) model varyantı seçilebiliyordu
- Artık
dtype parametresiyle çok daha geniş bir listeden seçim yapılabiliyor
- Kullanılabilen nicemleme listesi modele göre değişir; ancak genel olarak tam hassasiyet (
"fp32"), yarım hassasiyet ("fp16"), 8-bit ("q8", "int8", "uint8"), 4-bit ("q4", "bnb4", "q4f16") gibi seçenekler bulunur
- Modül bazlı
dtypes
- Whisper veya Florence-2 gibi bazı encoder-decoder modelleri, özellikle encoder tarafındaki nicemleme ayarlarına çok duyarlıdır
- Bu nedenle, modül adından
dtype'a eşleme sağlayarak modül bazlı dtypes seçebilme özelliği eklendi
Desteklenen 120 mimari
- Bu sürümle birlikte desteklenen toplam mimari sayısı 120'ye çıktı ve farklı giriş biçimleri ile görevleri kapsıyor
- Dikkat çeken yeni mimariler arasında Phi-3, Gemma & Gemma 2, LLaVa, Moondream, Florence-2, MusicGen, Sapiens, Depth Pro, PyAnnote, RT-DETR ve diğerleri yer alıyor
25 örnek proje ve şablon
- Bu sürümün bir parçası olarak, WebGPU desteğini öne çıkaran 25 yeni örnek proje ve şablon yayımlandı
- Phi-3.5 WebGPU, Whisper WebGPU gibi demolar da buna dahil
1200'den fazla önceden dönüştürülmüş model
- Sürüm itibarıyla topluluk, 1200'den fazla modeli Transformers.js ile uyumlu olacak şekilde dönüştürdü
- Kendi modelinizi veya fine-tuning çıktılarınızı dönüştürmek için sağlanan dönüştürme betiklerini kullanabilirsiniz
- Oluşturulan dosyaları Hugging Face Hub'a yükledikten sonra
transformers.js etiketini eklerseniz, başkaları bunları kolayca bulup kullanabilir
Node.js (ESM + CJS), Deno ve Bun uyumluluğu
- Transformers.js v3 artık en popüler üç sunucu tarafı JavaScript runtime'ı ile uyumlu
- Node.js: Chrome'un V8'i üzerine kurulu, yaygın olarak kullanılan bir JavaScript runtime'ıdır; geniş kütüphane ve framework desteği sunar
- Deno: JavaScript ve TypeScript için, varsayılan olarak güçlü güvenlik sunan modern bir runtime'dır; ES modüllerini kullanır ve deneysel WebGPU desteği de sağlar
- Bun: Performans için optimize edilmiş hızlı bir JavaScript runtime'ıdır; yerleşik bundler, transpiler ve paket yöneticisi sağlar
NPM ve GitHub'da yeni yuva
- Transformers.js artık NPM'de resmi Hugging Face organizasyonu altında
@huggingface/transformers olarak yayımlanacak (@xenova/transformers yerine; bu ad v1 ve v2'de kullanılıyordu)
- Depo, GitHub'daki resmi Hugging Face organizasyonuna (https://github.com/huggingface/transformers.js) taşındı ve burası yeni yuvası olacak
1 yorum
Transformers.js - Tarayıcıda transformer çalıştırma
Doğrudan tarayıcıda çalışabilen Transformers.js