CN114219044B 一种图像分类方法、装置、终端及存储介质（深圳大学）.docxVIP

下载本文档

0
0
约2.3万字
约 40页
2026-01-19 发布于重庆
举报
版权申诉

CN114219044B 一种图像分类方法、装置、终端及存储介质（深圳大学）.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN114219044B(45)授权公告日2025.07.11

(21)申请号202111583881.0

(22)申请日2021.12.22

(65)同一申请的已公布的文献号申请公布号CN114219044A

(43)申请公布日2022.03.22

(73)专利权人深圳大学

地址518060广东省深圳市南山区南海大

道3688号

GO6V10/40(2022.01)GO6N3/0464(2023.01)GO6N3/08(2023.01)

(56)对比文件

CN112651438A,2021.04.13CN113408577A,2021.09.17审查员来文燕

(72)发明人雷柏英熊唯杨亮于恺威

汪天富

(74)专利代理机构深圳市君胜知识产权代理事

务所(普通合伙)44268专利代理师温宏梅

(51)Int.CI.

GO6V10/764(2022.01)权利要求书2页说明书12页附图8页

(54)发明名称

一种图像分类方法、装置、终端及存储介质

(57)摘要

CN114219044B本发明公开了一种图像分类方法、装置、终端及存储介质，方法通过获取待分类图像，将待分类图像输入目标分类模型，其中，目标分类模型包括卷积层、注意力层以及分类层；通过卷积层获取待分类图像的局部特征信息，得到第一特征图；通过注意力层对第一特征图进行全局建模，得到第二特征图；通过分类层对第二特征图进行图像分类，得到待分类图像对应的图像类别。本发明中的目标分类模型可以捕捉待分类图像的局部特征信息也可以进行全局建模，因此可以精确地预测出待分类图像对应的图像类别。解决了现有技术中深度卷积神经网络仅具备有捕

CN114219044B

获取待分类图像，将所述待分类图像输入目标分类模型，其中，所述目标分类模型

获取待分类图像，将所述待分类图像输入目标分类模型，其中，所述目标分类模型包括卷积层、注意力层以及分类层

S100

通过所述卷积层获取所述待分类图像的局部特征信息，得到第一特征图

S200

通过所述注意力层对所述第一特征图进行全局建模，得到第二特征图

5300

通过所述分类层对所述第二特征图进行图像分类，得到所述待分类图像对应的图像类别

S400

CN114219044B权利要求书1/2页

1.一种图像分类方法，其特征在于，所述方法包括：

获取待分类图像，将所述待分类图像输入目标分类模型，其中，所述目标分类模型包括卷积层、注意力层以及分类层；

通过所述卷积层获取所述待分类图像的局部特征信息，得到第一特征图；

通过所述注意力层对所述第一特征图进行全局建模，得到第二特征图，包括：所述注意力层包括若干级联的注意力模块和分层多头注意力模块，所述分层多头注意力模块包括具有层级关系的若干自注意力模块；将所述第一特征图输入第一个所述注意力模块，获取最后一个所述注意力模块输出的位置权重标定特征图，其中，所述位置权重标定特征图包括若干区域，每一所述区域具有一个位置权重值，每一所述位置权重值用于反映一个所述区域对应的空间注意力和通道注意力的高低；将所述位置权重标定特征图输入所述分层多头注意力模块，通过所述分层多头注意力模块输出所述第二特征图；

通过所述分类层对所述第二特征图进行图像分类，得到所述待分类图像对应的图像类别。

2.根据权利要求1所述的图像分类方法，其特征在于，所述卷积层包括若干级联的第一卷积块和最大池化层，所述通过所述卷积层获取所述待分类图像的局部特征信息，得到第一特征图，包括：

通过若干级联的所述第一卷积块对所述待分类图像进行卷积操作，得到初始特征图；通过所述最大池化层对所述初始特征图进行降采样，得到所述第一特征图。

3.根据权利要求1所述的图像分类方法，其特征在于，每一所述注意力模块包括分割注意力模块和坐标注意力模块，

所述分割注意力模块，用于根据输入的特征图输出权重标定特征图，其中，所述权重标定特征图包括若干区域，每一所述区域具有一个权重值，所述权重值的大小用于反映所述区域对应的通道注意力的高低；

所述坐标注意力模块，用于根据所述权重标定特征图输出所述位置权重标定特征图。

4.根据权利要求3所述的图像分类方法，其特征在于，所

您可能关注的文档

文档评论（0）

xm + 关注: 实名认证

文档贡献者

专业学习资料，专业文档

咨询Ta 进入空间

1亿VIP精品文档

更多 >

CN114219044B 一种图像分类方法、装置、终端及存储介质（深圳大学）.docxVIP