视觉效果

Imagenet-1K（1000类图像分类问题）是一项随着CNN的发展而优化的任务。 AlexNet宣布深度学习时代开始的TOP-5错误约为17%。当时，现有顶级技术（SIFT + FV）的TOP-5错误约为26% ...

这是由设计师Iskander Utebayev创作的AR Glass概念视频。即使是概念视频，它也相当不错，并且一旦实现，我认为有可能极大地改变使用智能设备的人机界面。应用AI技术…

我听说过一些故事，如果您接受了特殊的培训，您就可以通过嘴唇的移动来知道您在说什么，但是链接中的研究是通过AI实现的。

基于深度学习的超分辨率技术在NVidia的最新GPU中采用了DLSS（深度学习超级采样）的名称，并成为消费者的一项真正的服务技术。为了降低4K游戏市场中4K渲染的成本，2K…

图像中常用的卷积是3D操作。（KxKxC; K =内核大小，C =通道数）通过将其划分为KxKx1的多个2D运算来应用之后，在通道方向上应用大小为1x1xC的卷积的深度可分离卷积大大减少了参数数量。

LipGan是一项根据语音信号创建嘴形的研究。这是一种对创建虚拟角色的嘴部动画有用的技术，但是在实际应用中，局限性很明显，因为只有站立的角色的嘴唇仍在移动。实际上，人类...

可视对话框任务是一种多模式任务，可将图像添加到由问答组成的Q＆A任务中。例如，如果您一起给一只白色的猫和一只黑色的狗拍照，然后问：“猫旁边的动物是什么颜色？”，您回答“黑色” ...

我们共享了在SIGGRAPH 2019上发表的论文``学习面向二维运动重定向的字符不可知运动''的项目页面。本文从三个（可能不同）的图像中提取运动，骨骼和相机角度，然后……

在游戏制作方面，我们共享一个指向经常使用的Adobe Mixamo网站的链接。输入时，将上载121个3D字符和2484个字符动作，并且可以以称为（Autodesk）FBX的3D格式下载它们。这种格式...