반응형
HuBERT: Self-Supervised Speech Representation Learning by Masked Prediction of Hidden UnitsSelf-supervised speech representation learning은 다음의 문제에 대응할 수 있어야 함:- 각 input utterance에 multiple sound unit이 존재함- Pre-training phase에서 input sound unit에 대한 lexicon이 존재하지 않음- Sound unit은 explicit segmentation이 아닌 variable length를 가짐HuBERTBERT-like prediction loss의 aligned target label을 제공하기 위해 offline clus..
Paper/Representation
2025. 4. 13. 09:20
반응형
