ElevenLabs Voice Isolator - Yalnızca sesi temiz biçimde ayırma
(elevenlabs.io)- Film, podcast, röportaj gibi içeriklerde arka plan gürültüsünü kaldırıp yalnızca sesi temiz şekilde çıkarır
- En fazla 500 MB ve 1 saate kadar ses dosyalarını destekler
- Müzik vokalleri için tasarlanmamış veya optimize edilmemiştir (içeriğe bağlı olarak başarılı olabilir)
- Gerçek zamanlı yayın için API henüz yayımlanmadı, ancak yakında sunulması planlanıyor
- Ücretlendirme, sesin dakikası başına 1000 karakterdir
6 yorum
Bu ne anlama geliyor? Neden karakter sayısı geçiyor, anlayamadım.
Token gibi bir kavram değil mi?
GPT'de görsellerin de text token'lar gibi hesaplanması gibi.
Şirketin sunduğu diğer hizmetlere bakınca bu anlaşılıyor. Sanırım Speech to text to Speech yöntemiyle çalışıyor; bu yüzden aradaki metin için ücret alıyorlar.
Bu arada, çeşitli açık modeller üzerinden ücretli ve ücretsiz vokal ayırma hizmeti sunan MVSep de birkaç tür ses/gürültü ayırma modeli sağlıyor.
https://mvsep.com
Adobe Podcast AI da benzer bir özellik sunuyor. Ücretsiz bir sürümü de var gibi görünüyor: https://podcast.adobe.com/enhance
Ücretsiz sürüm ölçütünde Korece için pek optimize edilmemiş gibi hissettirdi..