- 0
- 0
- 约8.81千字
- 约 17页
- 2026-01-24 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119293179A(43)申请公布日2025.01.10
(21)申请号202411384385.6
(22)申请日2024.09.30
(71)申请人周住喜
地址100023北京市朝阳区垡头建工双合
家园C区4号楼5单元
(72)发明人周住喜
(51)Int.CI.
GO6F16/3329(2025.01)
GO6N5/022(2023.01)
GO6F16/36(2019.01)
G16H50/70(2018.01)
G16H80/00(2018.01)
权利要求书2页说明书5页附图3页
(54)发明名称
一种基于医学图谱的检索增强生成方法
(57)摘要
CN119293179A本发明公开了一种基于医学图谱的检索增强生成方法,属于人工智能和医学信息处理领域。该方法包括三个主要步骤:(1)医学图谱构建:通过语义文档分段、元素提取、层次链接、关系链接以及标签生成和图谱合并,构建多层次医学知识图谱;(2)图谱检索:使用U-retrieve方法,根据用户查询在构建的图谱中检索相关信息;(3)文本生成:基于检索结果生成准确、全面的回答。本方法通过整合大规模医学文献、教科书和临床数据,显著提高了大语言模型在医学领域的回答准确性和可解释性。它能够生成包含证据来源的详细回答,有效避免了幻觉问题。本发明为医疗决策支持、医学教育和患者咨询等领域
CN119293179A
用户查询
用户查询
生成查询标签顶层图谱匹配
递归子图匹配
返回相关实体及关系
全局知识图谱
CN119293179A权利要求书1/2页
2
1.一种基于医学图谱的检索增强生成方法,其特征在于,包括以下步骤:
a)医学图谱构建,包括:
-对医学文档进行语义分段,生成语义连贯的文本块;
-从语义块中提取医学实体及其属性;
-构建三层医学知识图谱结构;
-识别实体间关系,创建加权有向图;
-生成图谱摘要标签并合并为全局图谱;
b)基于用户查询进行图谱检索;
c)生成包含证据来源的回答文本。
2.如权利要求1所述的方法,其特征在于,所述语义分段包括以下步骤:
a)使用换行符将文档分隔成初步段落;
b)对每个段落应用命题转移技术,将其转换为一系列自足的陈述或命题;
c)使用大语言模型分析每个命题,决定是否应该将其与现有块合并或创建新的块,该过程使用滑动窗口技术,每次处理5个段落;
d)设置硬阈值,确保每个块不超过预定的上下文长度限制;
e)通过以上步骤生成一系列语义连贯、自包含的文本块。
3.如权利要求1所述的方法,其特征在于,所述医学实体及其属性的提取包括以下步
骤:
a)使用大语言模型分析每个语义块,提取其中的医学实体;
b)对于每个实体,输出实体名称、实体类型和实体描述;
c)实体类型从预定义的专业医学术语列表中选择;
d)对每个块重复进行多次实体提取,以确保提取的完整性和质量;
e)为每个提取的实体分配唯一ID,包含实体来源的文档信息和段落信息。
4.如权利要求1所述的方法,其特征在于,所述三层医学知识图谱结构的构建包括以下步骤:
a)第一层:使用从用户提供的私有文档中提取的实体构建基础图谱;
b)第二层:将第一层的实体链接到由医学教科书和学术文章构建的基础医学知识图谱,使用实体对齐技术进行匹配和链接;
c)第三层:将第二层图谱进一步连接到权威医学资源中的标准医学术语;
d)通过这种分层结构,将特定文档中的医学实体置于更广泛的医学知识背景中。
5.如权利要求1所述的方法,其特征在于,所述实体间关系的识别和加权有向图的创建包括以下步骤:
a)使用大语言模型分析每对相关实体,识别它们之间可能存在的关系;
b)关系类型包括但不限于”是...的症状”、用于治疗、是...的并发症等;
c)对于识别出的每种关系,赋予一个权重值,表示关系的强度或重要性;
d)权重基于关系在文献中出现的频率、模型的置信度等因素确定;
e)将识别出的关系表示为有向边,构建加权有向图,其中节点是医学实体,边是它们之间的关系,边的权重表示关系的强度。
6.如权利要求1所述的方法,其特征在于,所述图谱摘要标签的生成和图谱合并包括以
CN119293179A
您可能关注的文档
- CN119296376A 一种基于多模态物联感知的公路风险模拟避让系统及方法 (四川云控交通科技有限责任公司).docx
- CN119296322A 基于全息图的路网安全预警方法、装置及存储介质 (深圳市拓必达科技有限公司).docx
- CN119296239A 基于视频远程监控的防盗监测预警方法 (广州市伟粤通讯设备有限公司).docx
- CN119295886A 基于多尺度特征融合的X-ray图像违禁品检测方法 (齐鲁工业大学(山东省科学院)).docx
- CN119295883A 一种基于多模态感知融合的自主机器人决策系统及其方法 (龙岩丽泰信息技术有限公司).docx
- CN119295827A 通过深度学习增强缺陷检测效率的无损探伤方法 (苏州天顺复合材料科技有限公司).docx
- CN119295660A 一种深度学习和计算机视觉的桥梁结构裂缝位置识别方法 (广州航海学院).docx
- CN119295638A 基于高斯泼溅的图像渲染方法、装置、设备、存储介质及程序产品 (北京大学深圳研究生院).docx
- CN119295621A 基于高斯泼溅的高保真大规模场景渲染方法、系统、设备及介质 (上海赜深数字科技有限公司).docx
- CN119295570A 用于编码-解码点云的几何结构的方法和设备 (交互数字Vc控股公司).docx
- 深度解析(2026)《SYT 6788-2020水溶性油田化学剂环境保护技术评价方法》.pptx
- 2025秋最新部编人教版小学三年级上学期看图写话练习大全.docx
- 深度解析(2026)《SYT 6881-2024高含硫气田采出水处理及回注工程设计规范》.pptx
- 深度解析(2026)《SYT 5421-1991石油勘探开发仪器基本环境试验 试验E恒定湿热试验方法》.pptx
- 深度解析(2026)《SYT 5426-2016石油天然气钻井工程 岩石可钻性测定与分级》.pptx
- 深度解析(2026)《SYT 5490-2016钻井液试验用土》.pptx
- 高考英语一轮-选必全四册词词形转换+重点短语精要手册(复习讲义)(北京专用).docx
- 深度解析(2026)《SYT 5533-2016石油钻机用DS系列电磁涡流刹车》.pptx
- 深度解析(2026)《SYT 5593-2016井筒取心质量规范》.pptx
- 曼谷全新体验之旅:无自费行程.pdf
原创力文档

文档评论(0)