- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120277223A(43)申请公布日2025.07.08
(21)申请号202510765415.6
(22)申请日2025.06.10
(71)申请人南京迅集科技有限公司
地址210046江苏省南京市栖霞区马群街
道紫东路1号紫东国际创意园西区F1栋607室
(72)发明人冯钟灵李旭党鑫马伟
GO6FGO6F
GO6FGO6N
40/30(2020.01)18/231(2023.01)
18/22(2023.01)
5/022(2023.01)
(74)专利代理机构南京佰腾智信知识产权代理
事务所(普通合伙)32509专利代理师黄杭飞
(51)Int.CI.
GO6F16/36(2019.01)
GO6F16/35(2025.01)
GO6F16/334(2025.01)
GO6F16/335(2019.01)
权利要求书3页说明书12页附图2页
(54)发明名称
基于多模态大模型的动态向量知识库构建与检索方法
(57)摘要
CN120277223A本发明属于知识检索技术领域,本发明公开了基于多模态大模型的动态向量知识库构建与检索方法,包括:获取多源异构模态数据集,并对其进行预处理和模态规范化处理,获得标准化多模态数据集;利用预训练多模态大模型进行特征提取和语义向量表示生成,构建多模态知识向量集;对多模态知识向量集进行语义关联分析与层次聚类,构建结构化向量知识库;对向量知识库进行语义相似度计算和关系建模,形成向量关系网络;基于用户输入的混合模态查询信息进行意图分析与向量表示,结合向量关系网络实现高效相似性检索;通过用户反馈进行动态优化,实现
CN120277223A
多模态大模型
多模态大模型
混合模态查询信息
图分析
查询向量表示
开始
采颗
多源异构模态数据
集
多模态知识向量集
,层次聚失向量知识图谱结构
向量知识库
向量间关系建模
向量关系网络
1性柏索初始检素结果集
优化检素结果集
CN120277223A权利要求书1/3页
2
1.基于多模态大模型的动态向量知识库构建与检索方法,其特征在于,包括:
步骤一:获取多源异构模态数据集,并对所获得的多源异构模态数据集进行预处理和模态规范化处理,获得相应的标准化多模态数据集;
步骤二:基于预先构建的多模态大模型对标准化多模态数据集进行特征提取和语义向量表示生成,获得相应的多模态知识向量集;
步骤三:对所获得的多模态知识向量集进行语义关联分析与层次聚类,构建向量知识图谱结构,并基于向量知识图谱结构构建结构化的向量知识库;
步骤四:对所获得的向量知识库进行语义相似度计算和向量间关系建模,获得相应的向量关系网络;
步骤五:对用户输入的混合模态查询信息进行多模态查询理解与意图分析,获得相应的查询向量表示;并结合向量关系网络进行高效相似性检索,获得相应的初始检索结果集;
步骤六:对所获得的初始检索结果集进行动态反馈优化,得到优化检索结果集。
2.根据权利要求1所述的基于多模态大模型的动态向量知识库构建与检索方法,其特征在于,设置数据采集单元,所述数据采集单元用于从多个数据源收集并整合不同的模态数据集合,获得相应的多源异构模态数据集;所述多源异构模态数据集包括文本数据、图像数据、音频数据和视频数据。
3.根据权利要求2所述的基于多模态大模型的动态向量知识库构建与检索方法,其特征在于,标准化多模态数据集的获取过程包括:
对所获得的多源异构模态数据集进行模态识别和格式转换,获得相应的初始模态数据集;
对所获得的初始模态数据集进行数据清洗和异常值检测,获得相应的净化模态数据集;
对所获得的净化模态数据集进行数据增强和归一化处理,获得相应的增强模态数据集;
对所获得的增强模态数据集进行跨模态对齐和时序同步,获得相应的多模态对齐数据集;
对所获得的多模态对齐数据集进行特征标准化处理和维度一致性处理,获得相应的标准化多模态数据集。
4.根据权利要求3所述的基于多模态大模型的动态向量知识库构建与检索方法,其特征在于,多模态知识向量集的获取过程包括:
基于已知的模态类型选取适用于不同模态数据的预训练大模型组件;对所选取的预训练大模型组件进行集成,并基于其构建相应的多模态大模型;
基于所构建的多模态大模型对相应标准化多模态数据集进行特征提取,获得相应的模态特征
您可能关注的文档
- CN120264314A 传输与测量相关的信息的方法及装置 (北京小米移动软件有限公司).docx
- CN120264420A 在边缘计算系统中提供数据的方法和装置 (三星电子株式会社).docx
- CN120265213A 血管闭合装置及方法 (阿特里卡有限公司).docx
- CN120265223A 再通装置及相关联的系统和方法 (英艾里医疗公司).docx
- CN120265526A 一种用于固定容器的系统和方法 (家得宝国际公司).docx
- CN120266443A 联合通信和环境感知的方法 (大陆汽车科技有限公司).docx
- CN120267797A 治疗糖尿病、肝炎和-或炎症性肝病的方法 (康涅狄格大学).docx
- CN120268230A 用于将配体偶联至复合材料的方法 (默克密理博有限公司).docx
- CN120268799A 一种用连铸连轧坯料生产1235合金电缆铝箔的方法 (洛阳龙鼎铝业有限公司).docx
- CN120268800A 一种铸轧8021合金铝箔的制备方法 (洛阳龙鼎铝业有限公司).docx
最近下载
- 08J907 洁净厂房建筑构造.pdf VIP
- 中等职业学校中餐烹饪专业人才培养方案1.pdf VIP
- 英威腾(INVT)MH600交流伺服驱动系统中文说明书.pdf
- 第十一章 电路及其应用 单元小结:建筑模型的电路设计--高二上学期物理人教版(2019)必修第三册.docx VIP
- SY-T 5416.1-2016 定向井测量仪器测量及检验 第1部分:随钻类.pdf VIP
- 2022年度民主生活会整改工作方案.docx VIP
- 癌症疼痛与心理护理的综合治疗.ppt VIP
- 机械设计基础习题集(段志坚)习题参考答案.docx VIP
- 2025基层党支部书记述职述廉报告(详细版)(1).pdf VIP
- 联络陪同口译.pdf
原创力文档


文档评论(0)