반응형

PriorSinger: Singing Voice Synthesis Model with Prior Condition Cross AttentionSinging voice synthesis는 주어진 musical score를 기반으로 expressive, realistic singing을 생성하는 것을 목표로 함PriorSingerDenoising process 중에 prior cross-attention transformer를 사용하여 diffusion denoiser를 guidingGenerated acoustic feature resolution을 향상하기 위해 diffusion denoiser 내에서 time/frequency domain에 대한 attention mechanism을 도입추가적으로 ro..
Paper/SVS
2025. 3. 21. 17:56
반응형