言语

11 月22020

言语趋势

借助咳嗽声预测电晕19感染的AI技术

言语, 趋势

Corona 19尚未在全球范围内表现出平静的迹象。在麻省理工学院，我们学习了一种AI模型，该模型可以通过用手机记录的咳嗽声来检查是否存在Corona 19感染，并以此发表了方法论和实验结果。在实验结果中...

10 月72020

视觉效果言语码

Wav2Lip：通过声音创建唇形

视觉效果, 言语, 码

LipGAN是一种使用语音信号生成脸部图像的嘴唇形状的技术，当将其实际应用于视频时，在视觉伪像和运动自然度方面有些令人失望。为了改善这一点，鉴别器不是单个帧，而是多个连续的…

9 月112020

视觉效果言语码数据

Lip2Wav：仅通过嘴唇移动即可生成语音信号

视觉效果, 言语, 码, 数据

我听说过一些故事，如果您接受了特殊的培训，您就可以通过嘴唇的移动来知道您在说什么，但是链接中的研究是通过AI实现的。

8 月192020

言语码

FastSpeech2开源

言语, 码

TensorflowTTS是基于Tensorflow 2的开源，它支持几种最新的TTS模型，例如Tacotron2，MelGan，FastSpeech等，终于开始支持Microsoft FastSpeech2。 FastSpeech2表现出与Transformer系列TTS类似的性能，但是学习时间却超过两倍。

8 月102020

视觉效果言语码