Interspeech 2020์ ๋ฐํ๋์๋ Facebook์ ์ค์๊ฐ ์ก์ ์ ๊ฑฐ ๊ธฐ์ ์ธ denoiser์ github ๋งํฌ๋ฅผ ๊ณต์ ํฉ๋๋ค.
Pytorch๋ก ๊ตฌํ๋์ด ์์ผ๋ฉฐ ์ ๋ ผ๋ฌธ ์ ๋ชฉ์ “Real Time Speech Enhancement in the Waveform Domain”์ ๋๋ค. ์ ๋ชฉ์์ ์ ์ ์๋ฏ์ด waveform ์์ญ์์ ๋ฐ๋ก speech enhancement๊ฐ ์ด๋ฃจ์ด์ง๋๋ก ๋์ด ์๋ ๊ฒ์ด ์ฃผ์ ํน์ง์ด๋ฉฐ, ๋ ธํธ๋ถ CPU์์๋ ์ค์๊ฐ ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํ๋๋ก ์๋์ ์ผ๋ก ๋ฎ์ ์ฐ์ฐ๋์ ๋ชฉํ๋ก ๊ฐ๋ฐ๋์๋ค๊ณ ํฉ๋๋ค.
ํนํ, stationary noise ๋ฟ๋ง ์๋๋ผ non-stationary noise์ ๋ํด์๋ ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํ ๊ฒ์ผ๋ก ๋ณด์ฌ์ ์์ฑ ์ธ์๊ธฐ์ ์ ์ฒ๋ฆฌ๋ถ์ ์ฌ์ฉํ๋ค๋ฉด ์ฑ๋ฅ ํฅ์์ ๊ธฐ๋ํ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค. ๊ธฐ๋ณธ์ ์ธ ๊ตฌ์กฐ๋ music source-separation ์ฉ์ผ๋ก ์ ์๋์๋ Demucs๋ฅผ ์ฌ์ฉํ๊ณ ์์ต๋๋ค. ์๋์ Demucs์ github ๋งํฌ๋ ๊ณต์ ํฉ๋๋ค.