大公网

大公报电子版
首页 > 新闻 > 中国 > 正文

首页-宜宾做假证_宜宾办毕业证 - 专业制作证件中心

2021年05月19日 04:37搜狗影视 作者:搜狗影视
字号
放大
标准
分享

首页-宜宾做假证_宜宾办毕业证 - 专业制作证件中心各类文凭,资质证件,户口证件,车辆类证件,企业证件,印章、票据与牌照等等.

  发布后马上有800万的恐怖销量,但目前来看,游戏的BUG还是很多的。

  首先,MediaPipeHolistic使用BlazePose的姿态检测器和关键点模型来估计人体姿态。然后,利用推导出的姿态关键点,推导出每只手(2x)和人脸的三个感兴趣区域(ROI),并采用重新裁剪模型提高ROI。

  然后,该管道将全分辨率输入帧到这些ROI中,并应用特定于任务的面部和手部模型来估计它们相应的关键点。

  最后,将所有关键点与姿态模型的关键点合并,得到完整的540多个关键点。

  为了简化ROI的识别,使用了一种类似于单独使用面部和手部管道的跟踪方法。这种方法假设对象在帧之间没有显著的移动,使用前一帧的估计作为当前帧中对象区域的指导。然而,在快速移动过程中,跟踪器可能会丢失目标,这就要求探测器在图像中重新定位目标。

  MediaPipeHolistic使用姿态预测(在每一帧上)作为额外的ROI,以减少快速移动时管道的响应时间。这也使得模型能够通过防止左手和右手之间的混淆,或者防止一个人的身体部位与另一个人的身体部位之间的混淆,从而保持身体及其部位的语义一致性。

  此外,对姿态模型的输入框架的分辨率很低,因此得到的面部和手部的ROI仍然不够精确,无法指导这些区域的重新裁剪,这就需要精确的输入裁剪才能保持轻量级。

  为了缩小这个精度差距,研究人员使用了轻量级的脸和手重新裁剪模型,它们扮演了spatialtransformers的角色,成本仅为相应模型推理时间的10%。

  性能

  MediaPipeHolistic要求每帧最多在8个模型之间协调:1个姿态检测器,1个姿态标志模型,3个重裁剪模型和3个手部和脸部关键点模型。

  在构建这个解决方案时,谷歌的研究人员不仅优化了机器学习模型,还优化了预处理和后处理算法(如仿射变换),由于流水线的复杂性,这些算法在大多数设备上都需要大量时间。

  在这种情况下,将所有的预处理计算移动到GPU上,整个管道的速度是原来的1.5倍。因此,即使在中间层设备和浏览器中,MediaPipeHolistic也能以接近实时的性能运行。

  MediaPipeHolistic的540多个关键点,旨在实现对身体语言、手势和面部表情的整体、同步感知。它的混合方法使远程手势界面,以及全身增强现实,体育分析,和手语识别。

  为了演示MediaPipe的整体性能和质量,谷歌构建了一个简单的远程控制界面,它可以在浏览器本地运行,并支持引人注目的用户交互,不需要鼠标或键盘。

  用户可以操作屏幕上的对象,坐在沙发上时在虚拟键盘上打字,指向或触摸特定的脸部区域(例如,静音或关闭摄像头)。在下面,它依靠精确的手势检测,然后将手势识别映射到固定在用户肩膀上的“轨迹板”空间,从而实现4米以内的远程控制。

  结论

责任编辑:搜狗影视

相关内容

点击排行