
AudioDec: An Open-Source Streaming High-Fidelity Neural Audio CodecTelecommunication과 같은 live application에 적합한 audio codec은 다음의 속성을 만족해야 함- Compression : signal을 transmit 하는데 필요한 bitrate는 가능한 낮아야 함- Latency : encoding, decoding은 최소한의 delay만으로 수행되어야 함- Reconstruction quality of signalAudioDec위 3가지 property를 모두 만족하는 streamable, real-time neural audio codec6ms 미만의 GPU에서 12kbps 만으로 동작하면서 고품질의 48kHz ..

SuperCodec: A Neural Speech Codec with Selective Back-Projection Network Neural speech coding은 우수한 compression 성능을 보여주지만, low bitrate에서 fine detail reconstruction의 한계가 있음 SuperCodec Low bitrate에서도 뛰어난 성능을 달성하기 위해 selective feature fusion을 가지는 back-projection method를 활용한 neural speech codec 특히 encoder, decoder의 standard up-/down-sampling layer를 대체하기 위해 Selective Up-sampling Back Projection, Selec..

SpatialCodec: Neural Spatial Speech CodingMulti-channel recording에 embed 된 spatial cue를 정확하게 reconstruct 하고 preserve 하기 위한 효과적인 encoding 방식이 필요함SpatialCodecSingle-channel neural sub-band와 SpatialCodec의 two phase로 구성된 neural audio coding framework Neural sub-band codec은 low bitrate로 reference channel을 encode 하고SpatialCodec은 decoder end에서 정확한 multi-channel reconstruction을 위해 relative spatial info..