- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN118364088B(45)授权公告日2025.07.08
(21)申请号202410635924.2
(22)申请日2024.05.21
(65)同一申请的已公布的文献号申请公布号CN118364088A
(43)申请公布日2024.07.19
(73)专利权人金叶天成(北京)科技有限公司地址100024北京市朝阳区朝阳北路白家
楼甲1号红庄国际文化保税创新园区
E-1-1
(72)发明人郭奇田立军
(51)Int.CI.
GO6N3/084(2023.01)
GO6N5/02(2023.01)
G16H70/20(2018.01)
G16H70/40(2018.01)
(56)对比文件
A,2023.12.08A,2024.04.05117195877117828050
A,2023.12.08A,2024.04.05
117195877
117828050
审查员范鹏
GO6F16/3329(2025.01)
GO6F16/334(2025.01)
GO6F40/284(2020.01)
GO6N3/045(2023.01)
权利要求书2页说明书7页附图2页
(54)发明名称
基于RAG和LLM技术的医学文献智能问答系统和方法
(57)摘要
CN118364088B本发明公开了一种基于RAG和LLM技术的医学文献智能问答系统和方法。系统包括embedding模型和GPT大模型;embedding模型由依次级联的输入层、词嵌入层、编码器、输出层组成;embedding模型训练方法包括数据收集、预训练数据准备、预训练、微调数据准备、微调模型步骤。问答方法包括构建本地知识库、通过向量检索的方法筛选出k条与用户提问最接近的答案作为参考依据、将问题和相关的答案构成prompt输入模型、通过大语言模型的理解分析生成最终答案步骤。本发明将RAG与医学文献相结合的方式,提升了用户获取内容的便利性,和用户获取知识的效率,实现大语言模型在医学领域的应用实践,提高医学研究人员的工作效率,帮助他们更
CN118364088B
输入层
词嵌入层
编码器自注意力机制层
前馈网络子层
输出层
[V1,V2,V3,….Vm]
CN118364088B权利要求书1/2页
2
1.一种基于RAG和LLM技术的医学文献智能问答系统,其特征在于:包括embedding模型和GPT大模型;
embedding模型由依次级联的输入层、词嵌入层、编码器、输出层组成;
输入层:将输入的自然语言文本分割成一个以上token,各token依次排列形成序列,序列中各token使用词汇表转换成相应的ID,ID为整数;输出相应的ID序列;
嵌入层:将所述ID序列映射为固定维度的词向量,所述词向量由单词向量表示Ewordembeding、token在序列中的位置信息Eposition_embedding、成对句子区分词向量Esegmentembedding组成;词嵌入层的输出向量为:
Eoutput=Eword_embedding+Eposition_embeding+Esegmentembeding;
编码器:由1个以上结构相同但参数不同的编码层串联组成;各编码层包括自注意力机制层和前馈神经网络层;
自注意力机制层对词嵌入层的输出向量进行如下处理:
步骤Z1:生成查询向量、键向量和值向量:嵌入层的输出向量通过相应的权重矩阵生成查询向量、键向量和值向量;
步骤Z2:关注度分数的计算:每个查询向量与所有键向量计算点积,用于表示查询和键之间相似度的关注度分数;
步骤Z3:关注度权重的计算:对每个查询向量的关注度分数应用softmax函数,归一化为概率形式,表示对应键向量的关注度权重;
步骤Z4:注意力向量的计算:将关注度权重与值向量相乘,得到注意力向量;
前馈神经网络层:对注意力向量处理步骤如下:
步骤Q1:第一个线性变换层将注意力向量的维度扩展n倍,n为预设倍数,得到扩展注意力向量;
步骤Q2:应用非线性激活函数处理扩展注意力向量;
您可能关注的文档
- CN116568179B 面膜组合物和方法 (莱雅公司).docx
- CN116596939B 一种基于线激光扫描的三文鱼智能分割方法 (大连工业大学).docx
- CN116604565B 一种机器人可变导纳的力引导控制方法及系统 (上海交通大学).docx
- CN116605255B 轨道交通车辆侧面疏散梯及其控制方法 (中车株洲电力机车有限公司).docx
- CN116671027B 基于载波频率调节来区分有源和无源nfc设备的系统和方法 (意法半导体(中国)投资有限公司).docx
- CN116778341B 一种雷达图像多视角特征提取与鉴别方法 (电子科技大学).docx
- CN116816154B 一种泳池清洁机器人系统及泳池清洁机器人的靠岸方法 (深圳市元鼎智能创新有限公司).docx
- CN116821292B 一种知识库问答中基于抽象语义表示的实体和关系链接方法 (东南大学).docx
- CN116902467B 一种货箱定位方法、装置、设备和存储介质 (北京极智嘉科技股份有限公司).docx
- CN116933083B 一种电离层总电子含量预测方法、系统、电子设备及介质 (昆明理工大学).docx
最近下载
- 结肠癌护理查房王婳.ppt VIP
- 水保工程施工方案与组织设计.docx VIP
- 2025年420联考《申论》真题(河北乡镇卷)及答案.docx VIP
- 高标准农田项目施工部施工进度计划和各阶段进度的保证措施.docx VIP
- 2023年甘肃省武威、平凉、天水、白银、金昌、定西、张掖、陇南、酒泉、庆阳中考语文真题含答案解析.docx VIP
- 2024年江苏高中学业水平合格性考试历史试卷真题.pdf VIP
- 家用智能扫地机器人的避障技术优化与清扫覆盖率提升研究答辩.pptx VIP
- 摩托车行业深度:内销与出口共振,大排量引领向上(202505).pdf VIP
- 毕业论文(设计)指导记录表.doc VIP
- 2025国家开放大学电大本科《商法》期末试题及答案.docx VIP
原创力文档


文档评论(0)