言语 Wav2Lip:通过声音创建唇形

FastSpeech2开源

TensorflowTTS是基于Tensorflow 2的开源,它支持几种最新的TTS模型,例如Tacotron2,MelGan,FastSpeech等,终于开始支持Microsoft FastSpeech2。 FastSpeech2表现出与Transformer系列TTS类似的性能,但是学习时间却超过两倍。

言语 Wav2Lip:通过声音创建唇形

Google MixIT AI-无监督学习声源的分离

由Google推出的MixIT AI是一项技术,该技术从混合了多个声源的单声道音频中获得单独的声源。它可以看作是盲目的源分离任务,并且与现有技术不同,它具有在无监督(!)的情况下提供出色性能的功能。