Tacotron2, MelGan, FastSpeech등 여러 최신 TTS 모델을 지원하는 Tensorflow 2 기반의 오픈소스인 TensorflowTTS가 드디어 Microsoft FastSpeech2를 지원하기 시작했습니다. FastSpeech2는 Transformer 계열의 TTS와 유사한 성능을 보이지만 학습에 걸리는 시간이 2배 이상 줄어들었고 Inference는 150배 이상 빠릅니다. 아래는 TensorflowTTS github 링크입니다.
TensorSpeech/TensorFlowTTS
:stuck_out_tongue_closed_eyes: TensorFlowTTS: Real-Time State-of-the-art Speech Synthesis for Tensorflow 2 (supported including English, Korean, Chinese) – TensorSpeech/TensorFlowTTS
Tensorflow 2로 만들어져 있으며 “Real-Time State-of-the-art Speech Synthesis for Tensorflow 2″라는 멋진 부제를 달고 있는 오픈 소스 프로젝트입니다. 업데이트도 굉장히 활발하게 이루어지고 있는데, 7/5일에는 TFlite 지원이 추가되었고, 7/17일에는 Multi-GPU training, 8/5일에 Korean TTS, 8/14일에 Chinese TTS가 추가되었습니다.
또한, 위 링크에 올라온 한국어 구현체 이외에도 저희 센터 파트너인 한동대 김인중 교수실에서 만든 버전도 있는데, 이와 관련된 github 링크도 첨부합니다.
HGU-DLLAB/Korean-FastSpeech2-Pytorch
FastSpeech2. Contribute to HGU-DLLAB/Korean-FastSpeech2-Pytorch development by creating an account on GitHub.