Google, uçtan uca nöral ses kodeği SoundStream’i duyurdu
(ai.googleblog.com)- Hem konuşma hem de müziğe uygulanabilen ilk nöral ağ kodeği
→ Akıllı telefon CPU’sunda gerçek zamanlı çalışabiliyor
→ Yüksek kaliteli ses ve net konuşmanın yanı sıra, gürültü ve yankının fazla olduğu konuşmalar, müzik ve çevresel sesler dahil çeşitli ses türlerini kodlayabiliyor
- Her iki uçta da sinir ağları kullanılarak eğitildiği için sıkıştırma ve ses kalitesi iyileştirmesini aynı anda gerçekleştirerek yüksek kaliteli ses sunuyor
→ SoundStream, 3kbps’te Opus 12 kpbs’i geride bırakıyor ve EVS 9.6bps seviyesinde kalite sunuyor
→ 3.2x-4x daha az bit kullandığı için veri aktarım miktarını büyük ölçüde azaltabiliyor
→ Oldukça iyi seviyede gürültü giderme sağlayabiliyor
- Yılın başında duyurulan düşük bit hızlı konuşma kodeği Lyra’ya entegre edilmesi planlanıyor
1 yorum
Opus'un da oldukça iyi olduğu biliniyor
Gerçekten etkileyici