선정 기준 : 작성자 마음대로 뽑습니다. 2002년도 앨범 결산 1. 개인적인 추천 앨범 Honeydip - : 청량한 바닷가 풍경을 머금은 신선한 슈게이즈 앨범입니다. 부드럽게 찰랑거리는 서프록 멜로디와 몽환적인 사운드 왜곡은 완전히 새로운 차원의 여름으로 리스너를 인도합니다. Honeydip - 'The Breakfast Club' 2. 올해의 국내 싱글 부활 - 'Never Ending Story' : 벼랑 끝에서 신들린 송라이팅을 발휘한 김태원과 객원보컬로 돌아온 애증의 이승철. 다사다난한 그 밴드명처럼, 부활은 침체기 끝에 다시 한 번 날아오르며 결국 끝나지 않을 전설을 만들어 냈습니다. 부활 - 'Never Ending Story' 3. 올해의 국내 앨범 언니네이발관 - : 전작 의 재평가와 ..
Pareto-aware Neural Architecture Generation for Diverse Computational Budgets 다양한 computational budget 하에서 효과적인 architecture를 설계하는 것은 배포에 필수적임 기존에는 주로 각 target budget에 대해 독립적인 architecture search를 수행 - 비효율적이고, 학습된 knowledge를 서로 공유할 수 없음 Pareto-aware Neural Architecture Generator (PNAG) 단일 학습만으로 주어진 budget에 대해 Pareto-optimal architecture를 동적으로 생성 다양한 budget에서 multiple Pareto-optimal architecture를..
선정 기준 : 작성자 마음대로 뽑습니다. 2001년도 앨범 결산 1. 개인적인 추천 앨범 advantage Lucy - : 일본에서는 종종 시부야계와 트위팝의 한 갈래를 Neo-Acoustic이라고 부르기도 합니다. 특히 advatage Lucy의 컴필레이션 앨범인 는 달콤하고 캐치한 싱글들만을 엄선하여 리스너에게 행복으로 여정을 제공합니다. advantage Lucy - 'Red Bicycle' 2. 올해의 국내 싱글 토이 - '좋은 사람' : 이후의 이런저런 논란은 차치하고, 유희열 특유의 역설적인 곡-가사 구성이 빛을 발한 대표적인 싱글입니다. 특히 밝고 경쾌한 전개에 대비되는 찌질한 짝사랑의 가사가 묘한 재미와 중독성을 자아냅니다. 토이 - '좋은 사람' 3. 올해의 국내 앨범 크라잉 넛 - : ..
UniSyn: And End-to-End Unified Model for Text-to-Speech and Sining Voice Synthesis Text-to-Speech와 Singing Voice Synthesis를 단일 시스템으로 통합하는 기존의 방법들은, 동일한 화자로 제한되거나 cascaded model에 의존하는 한계가 있음 UniSyn 음성 합성과 가창 합성을 통합한 end-to-end 모델 Speaker와 style을 condition으로 사용하는 Multi-Conditional Variational AutoEncoder 구조 Timbre와 style의 disentangle을 위한 supervised guided-VAE와 Wasserstein distance 기반 timbre pertur..
Diffusion-Based Generative Speech Source Separation Source separation을 위해 Stochastic Differential Equation을 활용할 수 있음 DiffSep 분리된 source에서 시작해 mixture를 중심으로 하는 Gaussian 분포로 수렴하는 continuous time diffusion-mixing proces를 활용 Diffusion-mixing process의 score function에 대한 marginal probability를 근사하는 neural network를 훈련 Neural network를 활용하여 mixture에서 source를 점진적으로 분리하는 reverse-time SDE를 solve 논문 (ICASSP 2..
WaveGlow: A Flow-Based Generative Network for Speech Synthesis Flow-based network는 autoregression 없이 mel-spectrogram에서 고품질 음성을 합성할 수 있음 WaveGlow 고품질 음성 합성을 위해 Glow와 WaveNet의 아이디어를 활용 Training data의 likelihood를 최대화하여 training 단계를 간단하고 안정적으로 만듦 논문 (ICASSP 2019) : Paper Link 1. Introduction 효율적이고 고품질의 음성 합성에 대한 요구사항은 점차 증대되고 있음 음성 품질, latency에 대한 작은 변화도 customer experience와 preference에 큰 영향을 미치기 때문..
Hybrid Transformers for Music Source Separation Music source separation에서 long range contextual information나 local acoustic feature는 유용하게 사용되는 정보임 Hybrid Transformer Demucs (HT Demucs) Hybrid Demucs 기반의 hybrid temporal/spectral bi-U-Net 구조 Innermost layer를 Transformer Encoder로 대체 하나의 domain에 대한 self-attention과 여러 domain 간의 cross-attention을 활용 논문 (ICASSP 2023) : Paper Link 1. Introduction Music S..
Glow-TTS: A Generative Flow for Text-to-Speech via Monotonic Alignment Search Parallel text-to-speech 모델은 externel aligner의 guidance 없이 학습하기 어려움 Glow-TTS Externel aligner가 필요 없는 flow-based parallel text-to-speech 모델 Flow property와 dynamic programming을 결합한 monotonic alignment search의 도입 Hard monotonic alignment를 사용하면 robust한 생성이 가능하고 flow를 활용하면 빠르고 다양한 생성이 가능 논문 (NeurIPS 2020) : Paper Link 1. Int..