본문 바로가기 메뉴 바로가기

Let IT Begin

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

Let IT Begin

검색하기 폼
  • 분류 전체보기 (563) N
    • Music (17)
      • Review (11)
      • Guide (6)
    • 결산 (38)
      • 2020's (8)
      • 2010's (10)
      • 2000's (10)
      • 1990's (10)
    • Paper (474) N
      • TTS (165)
      • SVS (24)
      • ASR (10)
      • Vocoder (69) N
      • Conversion (58)
      • Neural Codec (39)
      • Language Model (29)
      • Representation (43)
      • Verification (6)
      • Separation (6)
      • Signal Processing (6)
      • NAS (12)
      • ETC (7)
    • Algorithm (34)
      • Basic (34)
  • 방명록

Vocoder (67)
반응형
[Paper 리뷰] Hierarchical Diffusion Models for Singing Voice Neural Vocoder

Hierarchical Diffusion Models for Singing Voice Neural Vocoder Pitch, loudness, pronunciation 같은 다양한 음악적 표현으로 인해 neural vocoder로 고품질의 가창 음성을 합성하는 것은 어려움 서로 다른 sampling rate에 대한 multiple diffusion model을 도입 HPG (Hierarchical Diffusion Model + PriorGrad) Lower sampling rate 모델은 pitch와 같은 저주파 요소를 합성 다른 모델은 lower sampling rate와 acoustic feature를 기반으로 higher sampling rate waveform을 점진적으로 합성 논문 (ICASS..

Paper/Vocoder 2023. 9. 26. 12:15
반응형
이전 1 ··· 9 10 11 12 다음
이전 다음
최근에 올라온 글
최근에 달린 댓글
«   2025/10   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory

티스토리툴바