반응형
AutoVocoder: Fast Waveform Generation from a Learned Speech Representation Using Differentiable Digital Signal ProcessingMel-spectrogram은 waveform으로부터 간단하게 추출될 수 있지만, mel-spectrogram에서 waveform을 생성하는 vocoder에는 많은 계산 비용이 필요함AutoVocoder기존 mel-spectrogram 방식에서 벗어나 inverse STFT의 differentiable implementation을 사용하여 waveform을 생성결과적으로 기존 neural vocoder에 비해 14배 이상의 가속 효과를 달성논문 (ICASSP 2023) : Paper Link..
Paper/Vocoder
2024. 3. 27. 09:51
반응형
