본문 바로가기 메뉴 바로가기

Let IT Begin

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

Let IT Begin

검색하기 폼
  • 분류 전체보기 (588) N
    • Music (17)
      • Review (11)
      • Guide (6)
    • 결산 (39)
      • 2020's (9)
      • 2010's (10)
      • 2000's (10)
      • 1990's (10)
    • Paper (498) N
      • TTS (174) N
      • SVS (24)
      • ASR (11)
      • Vocoder (69)
      • Conversion (58)
      • Neural Codec (45)
      • Language Model (32)
      • Representation (47) N
      • Verification (6)
      • Separation (6)
      • Signal Processing (6)
      • NAS (12)
      • ETC (8)
    • Algorithm (34)
      • Basic (34)
  • 방명록

Sled (1)
반응형
[Paper 리뷰] Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space

Efficient Speech Language Modeling via Energy Distance in Continuous Latent SpaceSpeech language model은 discretization으로 인한 한계가 있음SLEDSpeech waveform을 continuous latent representation의 sequence로 encodingEnergy distance objective를 사용하여 autoregressive modeling을 수행논문 (NeurIPS 2025) : Paper Link1. IntroductionSpeech audio는 integer/floating-point range내의 value를 가지는 lengthy sampling point sequence로 re..

Paper/Language Model 2025. 11. 20. 13:50
반응형
이전 1 다음
이전 다음
최근에 올라온 글
최근에 달린 댓글
«   2026/01   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory

티스토리툴바