반응형

ContentVec: An Improved Self-Supervised Speech Representation by Disentangling SpeakersSpeech representation은 unwanted variation을 disentangle 할 수 있어야 함ContentVecContent의 loss 없이 speaker disentanglement를 수행HuBERT를 기반으로 teacher, student를 모두 regularize 하는 disentangling method를 도입논문 (ICML 2022) : Paper Link1. IntroductionHuBERT와 같은 Speech Self-Supervised Learning (SSL)은 large-scale unannotated corpo..
Paper/Representation
2025. 5. 18. 08:38
반응형