Get our free extension to see links to code for papers anywhere online!Free add-on: code for papers everywhere!Free add-on: See code for papers anywhere!

Add to Chrome

Add to Firefox

Add to Edge

LiLi Yin

SRTNet: Time Domain Speech Enhancement Via Stochastic Refinement

Oct 30, 2022

Zhibin Qiu, Mengfan Fu, Yinfeng Yu, LiLi Yin, Fuchun Sun, Hao Huang

Figure 1 for SRTNet: Time Domain Speech Enhancement Via Stochastic Refinement

Figure 2 for SRTNet: Time Domain Speech Enhancement Via Stochastic Refinement

Figure 3 for SRTNet: Time Domain Speech Enhancement Via Stochastic Refinement

Figure 4 for SRTNet: Time Domain Speech Enhancement Via Stochastic Refinement

Abstract:Diffusion model, as a new generative model which is very popular in image generation and audio synthesis, is rarely used in speech enhancement. In this paper, we use the diffusion model as a module for stochastic refinement. We propose SRTNet, a novel method for speech enhancement via Stochastic Refinement in complete Time domain. Specifically, we design a joint network consisting of a deterministic module and a stochastic module, which makes up the ``enhance-and-refine'' paradigm. We theoretically demonstrate the feasibility of our method and experimentally prove that our method achieves faster training, faster sampling and higher quality. Our code and enhanced samples are available at https://github.com/zhibinQiu/SRTNet.git.

Via

Access Paper or Ask Questions