[前研究组柳熙Jo]
姿势估计是跟踪视频中字符移动的视觉处理技术之一。提取并连接通常与面部标志相似的身体标志,以描述整个身体的姿势。在大多数情况下,目标是通过接收视频(尤其是实时cam数据)而不是单个静止图像来猜测对象的姿势。在这方面,以前 HyperGAN上的帖子如上所述,作为基于视频的模型,由于诸如成本和等待时间之类的原因,尽可能减少姿势估计的权重,然后在本地对其进行操作已变得越来越普遍。
Google Research推出了MoveNet的API,这是带有TensorFlow.js的轻量级姿势估计模型。我们发布了闪电般以速度为中心的版本和雷电以准确性为中心的版本的两种变体,它们都保证在最新的台式机和笔记本电脑环境中提供超过30 FPS的速度。 Mobile官方报告说,Pixel 5的iPhone / 12帧超过30帧。通过在其自己的移动设备(Galaxy Z Fold 2)上测试官方演示站点的结果,闪电版本约为15 FPS,而雷声约为10 FPS。
该研究小组似乎计划使用MoveNet专注于医疗保健,例如医院,保险公司和军队。
有关更多详细信息,请参阅Google在MoveNet上正式发布的以下链接。
链接:
https://storage.googleapis.com/tfjs-models/demos/pose-detection/index.html?model=movenet