반응형
FreGrad: Lightweight and Fast Frequency-aware Diffusion VocoderLightweight, fast diffusion-based vocoder를 사용하여 사실적인 audio를 합성할 필요가 있음FreGrad복잡한 waveform을 sub-band wavelet으로 decompose 하는 discrete wavelet transform을 적용Frequency awareness를 높이는 frequency-aware dilated convolution을 도입합성 품질을 향상할 수 있는 추가적인 bag of tricks를 소개논문 (ICASSP 2024) : Paper Link1. IntroductionNeural vocoder는 mel-spectrogram과 같은 ..
Paper/Vocoder
2024. 2. 27. 09:27
반응형
