본문 바로가기 메뉴 바로가기

Let IT Begin

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

Let IT Begin

검색하기 폼
  • 분류 전체보기 (470) N
    • Music (14)
      • Review (10)
      • Guide (4)
    • 결산 (37)
      • 2020's (7)
      • 2010's (10)
      • 2000's (10)
      • 1990's (10)
    • Paper (385) N
      • TTS (143)
      • SVS (22) N
      • ASR (7)
      • Vocoder (66)
      • Conversion (45)
      • Neural Codec (26) N
      • Language Model (21)
      • Representation (23) N
      • Verification (1)
      • Separation (6)
      • Signal Processing (6)
      • NAS (12)
      • ETC (7)
    • Algorithm (34)
      • Basic (34)
  • 방명록

2025/05/10 (1)
반응형
[Paper 리뷰] SpeechTokenizer: Unified Speech Tokenizer for Speech Language Models

SpeechTokenizer: Unified Speech Tokenizer for Speech Language ModelsSpeech language model은 semantic, acoustic token과 같은 discrete speech representation을 기반으로 구축됨SpeechTokenizerSpeech token이 speech language model에 적합한지를 evaluate 하기 위해 SLMTokBench를 도입Residual Vector Quantization에 기반한 encoder-decoder architecture를 채택하여 unified speech tokenizer를 구성 논문 (ICLR 2024) : Paper Link1. IntroductionSpeech Lan..

Paper/Neural Codec 2025. 5. 10. 08:57
반응형
이전 1 다음
이전 다음
최근에 올라온 글
최근에 달린 댓글
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Total
Today
Yesterday

Blog is powered by Tistory / Designed by Tistory

티스토리툴바