WaaS - Hizmet Olarak Whisper
(github.com/schibsted)- OpenAI Whisper (konuşma tanıma modeli) için yerelde kolay kullanım sağlayan GUI ve API açık kaynağı
transcribe/detect/downloadgibi işlevleri REST API olarak sunuyor- Web sayfası üzerinden ses/video dosyaları yüklenerek işlem başlatılabiliyor
docker-composeile çalıştırılıp kullanılabiliyor (redis/api/workerdahil 3 Docker konteyneri çalışıyor)- En küçük model olan
tinyyaklaşık 1 GB VRAM gerektiriyor (largeiçin en fazla 10 GB)
1 yorum
Whisper - OpenAI'nin açık kaynak olarak yayımladığı çok dilli konuşma tanıma sistemi (ASR)
OpenAI, Whisper v2 modelini duyurdu