Let IT Begin

[Paper 리뷰] Transfer NAS with Meta-Learned Bayesian Surrogates

Transfer NAS with Meta-Learned Bayesian Surrogates Neural Architecture Search는 높은 계산 비용과 roubstness의 부족함에 대한 한계가 있음 특히 대부분의 방법론들은 prior knowledge를 무시하고 scratch로 최적의 architecture를 search 함 TNAS 다양한 dataset에 대한 prior architecture 평가를 통해 meta-learning Deep-kernel Gaussian process, Architecture embedding을 위한 graph neural network, Transformer-based encoder에 대해 Bayesian Optimization을 활용 논문 (ICLR 2023)..

Paper/NAS 2024. 1. 14. 13:23

[Paper 리뷰] AutoDiffusion: Training-Free Optimization of Time Steps and Architectures for Automated Diffusion Model Acceleration

AutoDiffusion: Training-Free Optimization of Time Steps and Architectures for Automated Diffusion Model Acceleration Diffusion model은 이미지 생성을 위해 많은 수의 time step을 필요로 함 서로 다른 model은 추론 시간을 가속화하는 서로 다른 최적의 time step을 가질 수 있음 AutoDiffusion 추가적인 학습 없이 diffusion model에 대한 최적의 time step과 architecture를 search 가능 가능한 모든 time step과 다양한 architecture에 대한 unified search space 구성 최적의 solution을 찾기 위한 two-stag..

Paper/NAS 2024. 1. 13. 15:29

[결산] 2004년도 앨범 결산

선정 기준 : 작성자 마음대로 뽑습니다. 2004년도 앨범 결산 1. 개인적인 추천 앨범 The Killers - : 80년대 뉴웨이브와 2000년대 포스트-펑크 리바이벌의 새로운 교차점을 제시한 The Killers의 매력적인 데뷔 앨범입니다. 변화무쌍한 신스가 이끌어낸 화려한 트랙들과 밤거리를 닮은 어스름한 이면들 간의 조화는, 이 앨범을 고평가 할 수밖에 없도록 만듭니다. The Killers - 'Mr.Brightside' 2. 올해의 국내 싱글 못 - '카페인' : 각성제의 대표주자인 '카페인'이라는 제목과는 완전히 대비되는 성질을 전달하는 못의 아이러니한 싱글입니다. 앨범을 지배하는 빛바랜 신스와 차오르는 회색빛 기타는, 지독한 음울감으로 리스너를 서서히 침전시킵니다. 못 - '카페인' 3. ..

결산/2000's 2024. 1. 12. 17:05

[Paper 리뷰] InferGrad: Improving Diffusion Models for Vocoder by Considering Inference in Training

InferGrad: Improving Diffusion Models for Vocoder by Considering Inference in TrainingDenoising diffusion probabilistic model은 추론 과정에서 많은 반복이 필요하므로 추론 속도가 느림추론 속도 향상을 위해 추론 schedule을 최적화하는 것이 필요- However, 일반적으로 추론과 학습 process는 개별적으로 최적화됨InferGrad추론 process를 학습에 통합한 vocoder용 diffusion model학습 중 추론 schedule에 따라 reverse process를 통해 random noise로부터 data를 생성하여, 생성된 data와 실제의 차이를 최소화논문 (ICASSP 2022) :..

Paper/Vocoder 2024. 1. 11. 15:45

[Paper 리뷰] Personalized Lightweight Text-to-Speech: Voice Cloning with Adaptive Structured Pruning

Personalized Lightweight Text-to-Speech: Voice Cloning with Adpative Structured Pruning Personalized Text-to-Speech를 위해서는 많은 양의 recording과 큰 규모의 모델을 필요로 하므로 mobile device 배포에 적합하지 않음 이를 해결하기 위해 일반적으로 pre-train 된 Text-to-Speech 모델을 fine-tuning 하는 voice cloning을 활용함 - 여전히 pre-train된 대규모 모델에 기반을 두고 있어 한계가 있음 Adaptive Structured Pruning Trainable structured pruning을 voice cloning에 적용 Voice-cloning d..

Paper/TTS 2024. 1. 10. 13:22

[Paper 리뷰] LiteSing: Towards Fast, Lightweight and Expressive Singing Voice Synthesis

LiteSing: Towards Fast, Lightweight and Expressive Singing Voice Synthesis 경량화된 고품질의 Singing Voice Synthesis 시스템이 필요함 LiteSing Generative Adversarial Network architecture 하에서 악보의 full condition을 예측하고, 해당 condition에서 acoustic feature를 생성 Dynamic spectrogram energy, Voiced/Unvoiced decision, Dynamic pitch curve를 구성해 expressiveness를 향상 Pitch와 timbre를 개별적으로 예측하여 두 feature의 interdependence를 회피 논문 (IC..

Paper/SVS 2024. 1. 9. 16:51

[결산] 2003년도 앨범 결산

선정 기준 : 작성자 마음대로 뽑습니다. 2003년도 앨범 결산 1. 개인적인 추천 앨범 Longwave - : 뉴욕의 모두가 포스트-펑크 리바이벌의 열기에 한창 빠져있을 때, Longwave는 불친절한 슈게이즈의 세계로 빠져들어갔습니다. 그 결과 Longwave는 에서 분위기 있는 멜로디 라인과 윙윙거리는 기타 피드백을 조합하며 새로운 감성의 앨범을 만들어 냈습니다. Longwave -'Tidal Wave' 2. 올해의 국내 싱글 YB - '잊을게' : 시원한 윤도현의 보컬과 깔끔한 기타 라인이 인상적인 이 곡은, YB가 한참 정체성과 대중성의 경계에서 혼란을 겪던 시기에 발매되었습니다. 하지만 그 고민이 무색하게도 곡은 상업적으로 시원하게 성공해 버리며 나름의 방향성을 제시해 주었습니다. YB - '..

결산/2000's 2024. 1. 8. 20:03

[Paper 리뷰] LiteTTS: A Lightweight Mel-spectrogram-free Text-to-wave Synthesizer Based on Generative Adversarial Networks

LiteTTS: A Lightweight Mel-spectrogram-free Text-to-wave Synthesizer Based on Generative Adversarial Networks 빠른 속도로 고품질의 음성을 합성할 수 있는 lightweight end-to-end text-to-speech 모델이 필요 LiteTTS Feature prediction module과 waveform generation module을 결합한 single framework Feature prediction module은 input text 및 prosodic information에 대한 latent space embedding을 추정 Waveform generation module은 추정된 latent emb..

Paper/TTS 2024. 1. 8. 16:46

[Paper 리뷰] NAS-TasNet: Neural Architecture Search for Time-Domain Speech Separation

NAS-TasNet: Neural Architecture Search for Time-Domain Speech Separation Fully convolutional time-domain network인 Conv-TasNet은 speech separation에서 많이 사용되어 왔음 Conv-TasNet의 성능을 극대화하기 위해 Neural Architecture Search를 도입할 수 있음 NAS-TasNet Conv-TasNet의 search space를 구축하기 위한 candidate operation의 정의 최적의 separation module 구조를 결정하기 위한 gradient descent / reinforcement learning를 활용한 두 가지 search strategy 활용 균형..

Paper/Separation 2024. 1. 7. 14:26

이전 1 ··· 35 36 37 38 39 40 41 ··· 46 다음

이전 다음

최근에 올라온 글

최근에 달린 댓글

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Total

Today

Yesterday

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Let IT Begin

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역