- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120236155A(43)申请公布日2025.07.01
(21)申请号202510728593.1
(22)申请日2025.06.03
(71)申请人深圳友朋智能商业科技有限公司地址518000广东省深圳市宝安区航城街
道三围社区索佳科技园A栋A103
(72)发明人邱俊波黄超群陈俏锋
(74)专利代理机构成都恪睿信专利代理事务所(普通合伙)51303
专利代理师陈兴强
(51)Int.CI.
GO6V10/764(2022.01)
GO6V10/80(2022.01)
GO6V20/40(2022.01)
GO6V20/62(2022.01)
GO6V10/30(2022.01)
GO6V10/32(2022.01)
GO6V10/22(2022.01)
G06T7/11(2017.01)
G06T7/70(2017.01)
GO6V10/774(2022.01)GO6V10/82(2022.01)GO6N3/0464(2023.01)
GO6N3/08(2023.01)
权利要求书3页说明书17页附图6页
(54)发明名称
基于多模态数据处理的多目标商品识别方法、装置及系统
(57)摘要
CN120236155A本发明涉及智能售货技术领域,解决了现有技术中无法在多目标场景下准确地进行商品识别的问题,提供了一种基于多模态数据处理的多目标商品识别方法、装置及系统。该方法包括:获取商品交易场景下多帧实时图像;对实时图像进行预处理和标签信息提取,确定目标图像和商品标签对应的文字信息;对目标图像进行实例分割,确定商品位置信息;对目标图像进行特征提取,确定商品图像特征信息;根据预收集的智能售货场景下的多源私有化数据,对开源多模态视觉语言模型进行微调与优化处理,得到多模态大模型;将商品图像特征信息和文字信息输入多模
CN120236155A
识别。
获取商品交易场景下的实时视频数据,将所述实时视频数据分解为多顿实时图像
对所述实时图像进行预处理和标签信息提取,确定预处理后的目标图像和商标标签对应的文字信息
对所述目标图像进行实例分割,确定商品位置信息
根据所述商品位置信息,对所述目标图像进行特征提取,确定商品图像特征信息
根据预收集的智能售货场景下的多源私有化数据,对开源多模态
视觉语言模型进行微调与优化处理,得到用于商品识别的多模态
大模型
将所述商品图像特征信息和所述文字信息输入预训练的多模态大
模型中进行信息融合,根据融合特征
信息,确定商品目标识别结果
CN120236155A权利要求书1/3页
2
1.一种基于多模态数据处理的多目标商品识别方法,其特征在于,所述方法包括:
获取商品交易场景下的实时视频数据,将所述实时视频数据分解为多帧实时图像;
对所述实时图像进行预处理和标签信息提取,确定预处理后的目标图像和商品标签对应的文字信息;
对所述目标图像进行实例分割,确定商品位置信息;
根据所述商品位置信息,对所述目标图像进行特征提取,确定商品图像特征信息;
根据预收集的智能售货场景下的多源私有化数据,对开源多模态视觉语言模型进行微调与优化处理,得到用于商品识别的多模态大模型;
将所述商品图像特征信息和所述文字信息输入所述多模态大模型中进行信息融合,根据融合特征信息,确定商品目标识别结果。
2.根据权利要求1所述的基于多模态数据处理的多目标商品识别方法,其特征在于,所述对所述实时图像进行预处理和标签信息提取,确定预处理后的目标图像和商品标签对应的文字信息包括:
对所述实时图像进行尺寸调整和降噪处理,确定所述目标图像;
对所述目标图像进行目标检测,确定商品区域位置信息;
根据所述商品区域位置信息,通过光学字符识别技术对商品区域中的商品标签进行处理,确定所述文字信息。
3.根据权利要求2所述的基于多模态数据处理的多目标商品识别方法,其特征在于,所述对所述目标图像进行实例分割,确定商品位置信息包括:
根据所述商品区域位置信息,通过卷积神经网络提取商品区域
您可能关注的文档
- CN120041113B 一种用于硫化物固态电池的聚合物粘结剂及其制备方法、应用 (上海屹锂新能源科技有限公司).docx
- CN120045686B 一种基于知识图谱的交互式智能分析方法、设备及介质 (浪潮通用软件有限公司).docx
- CN120046432B 一种确定非均质土层边坡双临界滑动面的搜索方法 (南京工业大学).docx
- CN120047115B 一种基于有向无环图的合同事件依赖关系建模方法 (点击律(上海)网络科技有限公司).docx
- CN120047776B 基于Retinex-DCE-YOLOv5s的隧道机电设备识别方法及系统 (浙江省交通运输科学研究院).docx
- CN120055498B 一种基于高熵合金中间层扩散连接异质钛合金的方法 (西北工业大学).docx
- CN120063932B 一种泡沫玻璃加工用多工位检测装置及方法 (江苏德和绝热科技有限公司).docx
- CN120064472B 基于声发射信号频域迁移的输送带隐性损伤识别方法 (衡阳腾飞机械有限公司).docx
- CN120065754B 一种基于观测的自适应对数终端滑模控制方法和装置 (西北工业大学).docx
- CN120065760B 基于多点传感的液相色谱流速实时检测与优化控制方法 (上海衡领医药科技有限公司).docx
最近下载
- 国家开放大学电大专科《乡镇行政管理》期末题库及答案.pdf VIP
- 股东合作协议书模板(通用17篇).doc VIP
- 办公设备维护方案.docx VIP
- 在带头固本培元、增强党性等“五个带头”方面对照检查发言材料2篇稿(2026年).docx VIP
- 2025年养老院护理员工作总结范文(通用5篇).docx VIP
- 浅析企业员工流失的原因及对策——以福州永辉超市为例.docx VIP
- XK3190-C8技术手册.pdf VIP
- 广州市历年中考(2025-2026)化学试题(含答案).doc VIP
- 浙江省杭州市学军中学四校区2022-2023学年高二上学期期末物理试题(含答案解析).docx
- 《金瓶梅》中潘金莲“绣鞋”之物象探析.doc VIP
原创力文档


文档评论(0)