'SiTok' 태그의 글 목록

[Paper 리뷰] SiTok: Scaling Speech Tokenizers with Diffusion AutoEncoders

SiTok: Scaling Speech Tokenizers with Diffusion AutoEncodersSpeech tokenizer는 semantic/acoustic encoding trade-off와 low bitrate 활용의 한계가 있음SiTokSupervision을 통해 semantic-rich representation을 jointly learning 하고 diffusion을 통해 high-fidelity audio reconstruction을 지원추가적으로 1.6B parameter로 model을 scale 하고 2M hours의 speech dataset으로 training논문 (ICLR 2026) : Paper Link1. Introduction기존 speech tokenizer는 e..

Paper/Neural Codec 2026. 4. 17. 12:37

이전 1 다음

이전 다음

최근에 올라온 글

최근에 달린 댓글

« 2026/06 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Total

Today

Yesterday

Let IT Begin

티스토리툴바