一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法.pdf

下载文档

11
0
约1.39万字
约 12页
2020-09-14 发布于湖南
举报
版权申诉
保障服务

一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111428664 A (43)申请公布日 2020.07.17 (21)申请号 202010239278.X (22)申请日 2020.03.30 (71)申请人厦门瑞为信息技术有限公司地址 361000 福建省厦门市火炬高新区软件园华讯楼C区B1F-112 (72)发明人徐邵凯　 (74)专利代理机构北京康盛知识产权代理有限公司 11331 代理人梁锦平 (51)Int.Cl. G06K 9/00(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) 权利要求书2页说明书6页附图3页 (54)发明名称一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法 (57)摘要本发明适用于视频处理技术领域，提供了一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法，通过依次获取摄像头采集的当前帧图像，并进行归一化操作，使用预训练的神经网络模型与后处理算法对当前帧图像进行多人姿态估计，得到图像中所有人的人体关键点和人体骨架，从而实现多人姿态估计。本发明基于全图进行多人姿态估计，能够通过摄像头采集的图像快速准确的预测图片中所有人的人体关键点和骨架姿态，非常适合在安防领域用于判断人的行为和人体的姿态。本发明通过预训练 A 的神经网络，经过一次前向传播即可预测出图片 4 中所有人的人体姿态，运行速度不受图片中人数 6 6 8 多少的限制，因此可以更加快速稳定的运行。 2 4 1 1 1 N C CN 111428664 A 权　利　要　求　书 1/2页 1.一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法，其特征在于：包括以下步骤：获取摄像头采集的当前帧图像，并进行归一化操作；使用预训练的神经网络模型与后处理算法对当前帧图像进行多人姿态估计，得到图像中所有人的人体关键点和人体骨架。 2.如权利要求1所述的一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法，其特征在于：所述获取摄像头采集的当前帧图像，并进行归一化操作，具体为：从摄像头获取当前帧的RGB图片；对所述图片使用预设参数进行归一化处理；将所述图片缩放到宽576*高320。 3.如权利要求2所述的一种基于人工智能深度学习技术的计算机视觉的实时多人姿态估计方法，其特征在于：所述神经网络模型与后处理算法对当前帧图像进行多人姿态估计，具体为：所述神经网络模型的主干网络为ResNet50结构，输入大小为宽576、高320，使用 ResNet50的卷积部分提取多尺度特征，分别从ResNet50的四个残差组结构获得四种大小的 feature maps；接着将第一组feature maps进行2倍上采样后与第二组feature maps按通道拼接，前两组拼接后的feature maps经过卷积层与2倍上采样层后与第三组feature maps按通道拼接，前三组拼接后的feature maps经过卷积层与2倍上采样层后与第四组 feature maps按通道拼接；将第一组feature maps经过四个bottleneck结构后进行8倍上采样，将上述前两组拼接后的feature maps经过卷积层融合后再经过三个bottleneck结构后进行4倍上采样，将上述前三组拼接后的feature maps经过卷积层融合后再经过两个 bottl