白山哪里可以制作银行存单_仿真银行定期大额存单制作联系方式
“跨圈层、跨文化、跨次元联动的‘造星’,都是年轻人们喜闻乐见的表达方式,大家本来就喜欢在社交媒体上互动,喜欢谈论偶像八卦,所以这些做法很容易被他们接受——他们认识了K/DA,就有可能成为《英雄联盟》的新用户。
首先,MediaPipeHolistic使用BlazePose的姿态检测器和关键点模型来估计人体姿态。然后,利用推导出的姿态关键点,推导出每只手(2x)和人脸的三个感兴趣区域(ROI),并采用重新裁剪模型提高ROI。
然后,该管道将全分辨率输入帧到这些ROI中,并应用特定于任务的面部和手部模型来估计它们相应的关键点。
最后,将所有关键点与姿态模型的关键点合并,得到完整的540多个关键点。
为了简化ROI的识别,使用了一种类似于单独使用面部和手部管道的跟踪方法。这种方法假设对象在帧之间没有显著的移动,使用前一帧的估计作为当前帧中对象区域的指导。然而,在快速移动过程中,跟踪器可能会丢失目标,这就要求探测器在图像中重新定位目标。
MediaPipeHolistic使用姿态预测(在每一帧上)作为额外的ROI,以减少快速移动时管道的响应时间。这也使得模型能够通过防止左手和右手之间的混淆,或者防止一个人的身体部位与另一个人的身体部位之间的混淆,从而保持身体及其部位的语义一致性。
此外,对姿态模型的输入框架的分辨率很低,因此得到的面部和手部的ROI仍然不够精确,无法指导这些区域的重新裁剪,这就需要精确的输入裁剪才能保持轻量级。
为了缩小这个精度差距,研究人员使用了轻量级的脸和手重新裁剪模型,它们扮演了spatialtransformers的角色,成本仅为相应模型推理时间的10%。
性能
MediaPipeHolistic要求每帧最多在8个模型之间协调:1个姿态检测器,1个姿态标志模型,3个重裁剪模型和3个手部和脸部关键点模型。
在构建这个解决方案时,谷歌的研究人员不仅优化了机器学习模型,还优化了预处理和后处理算法(如仿射变换),由于流水线的复杂性,这些算法在大多数设备上都需要大量时间。
在这种情况下,将所有的预处理计算移动到GPU上,整个管道的速度是原来的1.5倍。因此,即使在中间层设备和浏览器中,MediaPipeHolistic也能以接近实时的性能运行。
MediaPipeHolistic的540多个关键点,旨在实现对身体语言、手势和面部表情的整体、同步感知。它的混合方法使远程手势界面,以及全身增强现实,体育分析,和手语识别。
为了演示MediaPipe的整体性能和质量,谷歌构建了一个简单的远程控制界面,它可以在浏览器本地运行,并支持引人注目的用户交互,不需要鼠标或键盘。
用户可以操作屏幕上的对象,坐在沙发上时在虚拟键盘上打字,指向或触摸特定的脸部区域(例如,静音或关闭摄像头)。在下面,它依靠精确的手势检测,然后将手势识别映射到固定在用户肩膀上的“轨迹板”空间,从而实现4米以内的远程控制。
结论
版权声明 |
关于我们 |
联系我们 |
广告服务 |
网站地图 | 回到顶部
电话:0595-28679111 传真:0595-22567376 地址:福建省泉州市泉秀街沉洲路莲花大厦4楼
CopyRight 2019 闽南网由福建日报社(集团)主管 版权所有 闽ICP备10206509号 互联网新闻信息服务许可证编号:35120190010
福建日报社(报业集团)拥有闽南网采编人员所创作作品之版权,未经福建日报社(报业集团)书面授权,不得转载、摘编或以其他方式使用和传播。
职业道德监督、违法和不良信息举报电话:0595-28679111 举报邮箱:jubao@mnw.cn 福建省新闻道德委举报电话:0591-87275327