'2026/03/09 글 목록

[Paper 리뷰] DiTSinger: Scaling Singing Voice Synthesis with Diffusion Transformer and Implicit Alignment

DiTSinger: Scaling Singing Voice Synthesis with Diffusion Transformer and Implicit AlignmentSinging Voice Synthesis는 data scarcity와 model scalability의 한계가 있음DiTSingerFixed melody와 LLM-generated lyrics를 pairing 하여 high-quality singing dataset을 구성추가적으로 RoPE, QK-norm을 기반으로 Diffusion Transformer의 scalability를 확장하고 implicit alignment mechanism을 도입논문 (ICASSP 2026) : Paper Link1. IntroductionSinging Vo..

Paper/SVS 2026. 3. 9. 10:47

이전 1 다음

이전 다음

최근에 올라온 글

최근에 달린 댓글

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Total

Today

Yesterday

Let IT Begin

티스토리툴바