码

视觉效果趋势码

皮克斯的超分辨率技术及其应用

皮克斯的超分辨率技术及其应用

视觉效果, 趋势, 码

基于深度学习的超分辨率技术在NVidia的最新GPU中采用了DLSS（深度学习超级采样）的名称，并成为消费者的一项真正的服务技术。为了降低4K游戏市场中4K渲染的成本，2K…

视觉效果码

皮克斯的超分辨率技术及其应用

通过语音创建身体动作

视觉效果, 码

LipGan是一项根据语音信号创建嘴形的研究。这是一种对创建虚拟角色的嘴部动画有用的技术，但是在实际应用中，局限性很明显，因为只有站立的角色的嘴唇仍在移动。实际上，人类...

皮克斯的超分辨率技术及其应用

FastSpeech2开源

TensorflowTTS是基于Tensorflow 2的开源，它支持几种最新的TTS模型，例如Tacotron2，MelGan，FastSpeech等，终于开始支持Microsoft FastSpeech2。 FastSpeech2表现出与Transformer系列TTS类似的性能，但是学习时间却超过两倍。

相互作用码数据

皮克斯的超分辨率技术及其应用

文本到SQL：将自然语言转换为SQL

相互作用, 码, 数据

文本到SQL是自动将自然语言转换为SQL的任务。我在底部分享的帖子是由Microsoft的Aerin Kim撰写的，它是关于Text-to-SQL的良好组织。在世界上，很多数据都是作为关系数据库构建的，在这个数据库中...

视觉效果言语码

皮克斯的超分辨率技术及其应用

Speech2根据语音信号进行人脸预测

视觉效果, 言语, 码

麻省理工学院的Speech2Face是一项通过语音信号生成说话者面部的研究。但是，它不使用一种模型执行语音到面对面的转换，而是将现有研究的结果用于不同目的进行组合以产生令人印象深刻的结果。（第一作者现在是...

皮克斯的超分辨率技术及其应用

Wav2Vec 2.0公开-创建具有10分钟语音的ASR

在对53,000小时的未标记数据进行了表示训练之后，发布了Facebook的wav2vec 2.0的预训练模型，该模型成为热门话题，因为它创建了仅带有10分钟标记数据的语音识别器。表示模型没有微调，...

视觉效果码

皮克斯的超分辨率技术及其应用

用于图像动画的一阶运动模型

视觉效果, 码

摇滚明星（Rockstars）于2011年拍摄的电影《洛杉矶黑色》（Los Angeles Noir）使面部动画效果远胜于其他游戏，许多人对此感到惊讶。这时使用的技术称为MotionScan，基本上，演员在一个房间里，精心地放置了多个摄像头...

视觉效果码

皮克斯的超分辨率技术及其应用

GANimation-用一张图像创建面部表情的研究

视觉效果, 码

它是GANimation的代码存储库，该技术可通过输入单个图像来创建可更改面部表情的动画。基本上，它是一个有条件的GAN，它使用FACS（面部动作编码系统）来描述面部的解剖运动。根据FACS，我们…

相互作用码

皮克斯的超分辨率技术及其应用

复制品：情感聊天机器人

相互作用, 码

AI聊天机器人的主要任务是回答问题，例如解释产品信息，通知日程安排和检查天气。也许，如果最大限度地利用这些技术，人类的某些领域被称为“知识”。