- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
20XX《AI健身》创业计划书-副本
-目录9.3产品技术框架
《AI健身》创业计划书-副本具体实现时,分为两个stage,GlobalNet和RefineNet其中GlobalNet主要负责检测容易检测和较难检测的关键点,对于较难关键点的检测,主要体现在网络的较深层,通过进一步更高层的语义信息来解决较难检测的关键点问题RefineNet主要解决更难或者不可见关键点的检测,这里对关键点进行难易程度进行界定主要体现在关键点的训练损失上,使用了常见的HardNegativeMining策略,在训练时取损失较大的top-K个关键点计算损失,然后进行梯度更新,不考虑损失较小的关键点网络结果如下图所示
《AI健身》创业计划书-副本1RMPE:本概述主要考虑的是自上而下的关键点检测算法在目标检测产生Proposals的过程中,可能会出现检测框定位误差、对同一个物体重复检测等问题2检测框定位误差,会出现裁剪出来的区域没有包含整个人活着目标人体在框内的比例较小,造成接下来的单人人体骨骼关键点检测错误3对同一个物体重复检测,虽然目标人体是一样的,但是由于裁剪区域的差异可能会造成对同一个人会生成不同的关键点定位结果4本文提出了一种方法来解决目标检测产生的Proposals所存在的问题,即通过空间变换网络将同一个人体的产生的不同裁剪区域(Proposals)都变换到一个较好的结果,如人体在裁剪区域的正中央,这样就不会产生对于一个人体的产生的不同Proposals有不同关键点检测效果5具体Pipeline如下图所示
《AI健身》创业计划书-副本
9.3产品技术框架1PART
9.3产品技术框架图9-3-1blaze算法逻辑图Blaze意为火焰、失火,反映了这一系列算法是从算法设计到实现都竭力追极速的特点,方便对运行速度要求比较高的AR/VR开发者使用BlazePose,一个轻量级的卷积神经网络架构,用于人体姿势估计,它是为移动设备上的实时推理量身定做的。在推理过程中,该网络为一个人产生33个身体关键点,并在Pixel2手机上以每秒超过30帧的速度运行。因此它特别适合实时用例,如健身追踪和手语识别。在Pixel3上GPU运行,BlazePose可以达到112FPS(framespersecond)论文(BlazePose:On-deviceReal-timeBodyPosetracking)提出新颖的身体姿态追踪解决方法和用热图和回归关键点的网路坐标技术搭建的轻巧身体姿态估计神经网络
9.3产品技术框架BlazePose是从达芬奇的《维特鲁威人》中得到的启发,可预测人的臀部中点、外接整个人的圆的半径以及连接肩部和臀部中点的直线的倾斜角度,共计可预测33个人体关键点01根据手和脚的比例和方向信息,即使是非常复杂的情况,比如特定的瑜伽姿态,其也能得到一致的追踪02
9.3产品技术框架图9-3-2《维特鲁威人》BlazePose是一种用于人体姿势估计的轻量级卷积神经网络体系结构,专为在移动设备上进行实时推理而设计。在推理过程中,该网络为单个人生成33个人体关键点,并在Pixel2手机上以每秒30帧的速度运行。这使其特别适合诸如健身跟踪和手语识别之类的实时用例。我们的主要贡献包括新颖的人体姿势跟踪解决方案和轻量级的人体姿势估计神经网络,该网络同时使用热图和回归关键点坐标1.介绍根据图像或视频进行人体姿势估计在各种应用(例如健康跟踪,手语识别和手势控制)中起着核心作用由于各种各样的姿势,众多的自由度(degreesodfreedom)和遮挡(occlusions),这项任务具有挑战性
9.3产品技术框架最近的工作在姿势估计方面显示出重大进展常用的方法是为每个关节生成热图(produceheatmapsforeachjoint)以及细化每个坐标的偏移量尽管这种热图选择可以以最小的开销将其扩展到多个人,但它使一个人的模型比适用于手机上的实时推断的模型大得多在本文中,我们解决了这个特殊的用例,并演示了该模型的显著加速,几乎没有质量的下降与基于热图(heatmaps)的技术相反,基于回归(regression)的方法虽然对计算的要求较低且可扩展性较高,但它们试图预测平均坐标值,但通常无法解决潜在的歧义已有一些研究表明,即使参数数量较少,堆叠式沙漏架构(stackedhourglassarchitecture)?也可以大大提高预测的准确性
9.3产品技术框架NEXT我们在工作中扩展了这个想法,并使用编码器-解码器网络体系结构(encoder-decodernetworkarchitecture)来预测所有关节的热图,随后是另一个直接回归到所有关节坐标的编码器
我们的工作的关键点是,热
您可能关注的文档
最近下载
- (一模)2026届大湾区普通高中毕业年级联合模拟考试(一)数学试卷(含答案).pdf
- 延世韩国语单词第一册.pdf VIP
- 张佩兰溶栓讲稿课件.ppt
- 实验室生物安全程序文件.docx VIP
- 子公司治理制度.docx VIP
- 北师大版小学数学二年级上册第七单元《分一分与除法》大单元教学方案.docx VIP
- 2025出生医学证明管理培训.pptx VIP
- 2025年甘肃省定西市安定区称钩驿镇选聘村干部笔试备考题库及答案解析.docx VIP
- 2025广东惠州市龙门县平陵街道招聘村“两委”干部储备人选16人考试参考题库及答案解析.docx VIP
- GB50345-2012 屋面工程技术规范.pdf VIP
原创力文档


文档评论(0)