Interspeech 2020에 발표되었던 Facebook의 실시간 잡음 제거 기술인 denoiser의 github 링크를 공유합니다.
facebookresearch/denoiser
Real Time Speech Enhancement in the Waveform Domain (Interspeech 2020)We provide a PyTorch implementation of the paper Real Time Speech Enhancement in the Waveform Domain. In which, we present a ca…
Pytorch로 구현되어 있으며 원 논문 제목은 “Real Time Speech Enhancement in the Waveform Domain”입니다. 제목에서 알 수 있듯이 waveform 영역에서 바로 speech enhancement가 이루어지도록 되어 있는 것이 주요 특징이며, 노트북 CPU에서도 실시간 처리가 가능하도록 상대적으로 낮은 연산량을 목표로 개발되었다고 합니다.
특히, stationary noise 뿐만 아니라 non-stationary noise에 대해서도 처리가 가능한 것으로 보여서 음성 인식기의 전처리부에 사용한다면 성능 향상을 기대할 수 있을 것 같습니다. 기본적인 구조는 music source-separation 용으로 제안되었던 Demucs를 사용하고 있습니다. 아래에 Demucs의 github 링크도 공유합니다.
facebookresearch/demucs
Code for the paper Music Source Separation in the Waveform Domain – facebookresearch/demucs