반응형
Personalized Lightweight Text-to-Speech: Voice Cloning with Adpative Structured PruningPersonalized Text-to-Speech를 위해서는 많은 양의 recording과 큰 규모의 모델을 필요로 하므로 mobile device 배포에 적합하지 않음이를 해결하기 위해 일반적으로 pre-train 된 Text-to-Speech 모델을 fine-tuning 하는 voice cloning을 활용함- 여전히 pre-train된 대규모 모델에 기반을 두고 있어 한계가 있음Adaptive Structured PruningTrainable structured pruning을 voice cloning에 적용Voice-cloning data로 s..
Paper/TTS
2024. 1. 10. 13:22
반응형
