[๊ฐ์์ธ๊ฐ์ฐ๊ตฌํ ํฉ์ค์ ]
NVIDIA NeMo๋ ๊ฐ๋จํ Python ์ธํฐํ์ด์ค๋ฅผ ์ฌ์ฉํ์ฌ GPU ๊ฐ์ ์์ฑ ๋ฐ ์์ฐ์ด ์ดํด ๋ชจ๋ธ์ ๊ตฌ์ถ, training ๋ฐ fine-tuningํ๊ธฐ ์ํ ์คํ์์ค ํ๋ ์์ํฌ์ ๋๋ค. NeMo๋ฅผ ํ์ฉํ๋ฉด ์ค์๊ฐ ์๋ ์์ฑ ์ธ์, ์์ฐ์ด ์ฒ๋ฆฌ, ํ ์คํธ ์์ฑ ๋ณํ ๋ฑ ์ ํ๋ฆฌ์ผ์ด์ ์ฉ ๋ชจ๋ธ์ ๊ตฌ์ถํ ์ ์๋ค๊ณ ํฉ๋๋ค.
NeMo์๋ ASR, NLP ๋ฐ TTS์ฉ ๋๋ฉ์ธ ๋ณ๋ก ์ฌ๋ฌ ๊ธฐ๋ฅ์ ํฌํจํ๋ฉฐ Citrinet, Jasper, BERT, Fastpitch, HiFiGAN๊ณผ ๊ฐ์ ์ต์ฒจ๋จ ๋ชจ๋ธ์ ๊ฐ๋ฐํ ์ ์์ต๋๋ค. NeMo๋ Neural Module๋ค๋ก ๊ตฌ์ฑ๋๋ฉฐ, ์ด๋ฌํ ๋ชจ๋์ ์ ๋ ฅ ๋ฐ ์ถ๋ ฅ์ ๋ชจ๋ ๊ฐ์ semantic check๋ฅผ ์๋์ผ๋ก ์ํํฉ๋๋ค. ์ด๋ฅผ ๋ค์ด์ด๊ทธ๋จ์ผ๋ก ํํํ๋ฉด ์๋์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ผ๋ฉฐ Hydra framework ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.
๋๊ท๋ชจ์ Transformer ๊ธฐ๋ฐ ์ธ์ด ๋ชจ๋ธ์ ํ ์คํธ ์์ฑ, ์์ฝ ๋ฐ ์ฑ๋ด๊ณผ ๊ฐ์ ๊ด๋ฒ์ํ ์์ฐ์ด ์์ ์ ์ ์ฉ๋๊ณ ์์ต๋๋ค. NeMo Megatron(530B)์ ํ๋ จ ๋ฐ์ดํฐ์ ๋ํด ์ ์ฒ๋ฆฌ ๊ธฐ๋ฅ ์ํ ๋ฐ ๋ฐ์ดํฐ๋ฅผ ์ ๋ณํ๊ณ ์ต๋ ์์กฐ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋๊ท๋ชจ ๋ชจ๋ธ์ ํ๋ จํ ์ ์๋ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค. NeMo Megatron์ ์ํคํ ์ณ๋ ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ผ๋ฉฐ, ํ์ฌ ์ผ๋ฆฌ์ต์ธ์ค๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
๋ง์ง๋ง์ผ๋ก, NeMo์ ๊ณต์ GitHub์ ํตํด ๊ฐ๋จํ ํํ ๋ฆฌ์ผ์ ์ ๊ณตํ๊ณ ์์ต๋๋ค. ๊ทธ ์ค์์, Audio Translation ํํ ๋ฆฌ์ผ์ด ์ฝ๊ฒ ์คํ์ํฌ ์ ์๊ณ , ์ง์ ๋ค์ด๋ณผ ์๋ ์๊ธฐ ๋๋ฌธ์ ํ๋ฒ ์คํ์์ผ๋ณด๋ ๊ฒ์ ์ถ์ฒ๋๋ฆฝ๋๋ค.
Reference
[1] https://developer.nvidia.com/nvidia-nemo
[2] https://github.com/NVIDIA/NeMo
[3] https://github.com/facebookresearch/hydra