皮克斯的超分辨率技术及其应用
基于深度学习的超分辨率技术在NVidia的最新GPU中采用了DLSS(深度学习超级采样)的名称,并成为消费者的一项真正的服务技术。为了降低4K游戏市场中4K渲染的成本,2K…
基于深度学习的超分辨率技术在NVidia的最新GPU中采用了DLSS(深度学习超级采样)的名称,并成为消费者的一项真正的服务技术。为了降低4K游戏市场中4K渲染的成本,2K…
LipGan是一项根据语音信号创建嘴形的研究。这是一种对创建虚拟角色的嘴部动画有用的技术,但是在实际应用中,局限性很明显,因为只有站立的角色的嘴唇仍在移动。实际上,人类...
TensorflowTTS是基于Tensorflow 2的开源,它支持几种最新的TTS模型,例如Tacotron2,MelGan,FastSpeech等,终于开始支持Microsoft FastSpeech2。 FastSpeech2表现出与Transformer系列TTS类似的性能,但是学习时间却超过两倍。
文本到SQL是自动将自然语言转换为SQL的任务。我在底部分享的帖子是由Microsoft的Aerin Kim撰写的,它是关于Text-to-SQL的良好组织。在世界上,很多数据都是作为关系数据库构建的,在这个数据库中...
麻省理工学院的Speech2Face是一项通过语音信号生成说话者面部的研究。但是,它不使用一种模型执行语音到面对面的转换,而是将现有研究的结果用于不同目的进行组合以产生令人印象深刻的结果。 (第一作者现在是...
在对53,000小时的未标记数据进行了表示训练之后,发布了Facebook的wav2vec 2.0的预训练模型,该模型成为热门话题,因为它创建了仅带有10分钟标记数据的语音识别器。表示模型没有微调,...
摇滚明星(Rockstars)于2011年拍摄的电影《洛杉矶黑色》(Los Angeles Noir)使面部动画效果远胜于其他游戏,许多人对此感到惊讶。这时使用的技术称为MotionScan,基本上,演员在一个房间里,精心地放置了多个摄像头...
它是GANimation的代码存储库,该技术可通过输入单个图像来创建可更改面部表情的动画。基本上,它是一个有条件的GAN,它使用FACS(面部动作编码系统)来描述面部的解剖运动。根据FACS,我们…