CN119293179A 一种基于医学图谱的检索增强生成方法 (周佺喜).docxVIP

  • 0
  • 0
  • 约8.81千字
  • 约 17页
  • 2026-01-24 发布于重庆
  • 举报

CN119293179A 一种基于医学图谱的检索增强生成方法 (周佺喜).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119293179A(43)申请公布日2025.01.10

(21)申请号202411384385.6

(22)申请日2024.09.30

(71)申请人周住喜

地址100023北京市朝阳区垡头建工双合

家园C区4号楼5单元

(72)发明人周住喜

(51)Int.CI.

GO6F16/3329(2025.01)

GO6N5/022(2023.01)

GO6F16/36(2019.01)

G16H50/70(2018.01)

G16H80/00(2018.01)

权利要求书2页说明书5页附图3页

(54)发明名称

一种基于医学图谱的检索增强生成方法

(57)摘要

CN119293179A本发明公开了一种基于医学图谱的检索增强生成方法,属于人工智能和医学信息处理领域。该方法包括三个主要步骤:(1)医学图谱构建:通过语义文档分段、元素提取、层次链接、关系链接以及标签生成和图谱合并,构建多层次医学知识图谱;(2)图谱检索:使用U-retrieve方法,根据用户查询在构建的图谱中检索相关信息;(3)文本生成:基于检索结果生成准确、全面的回答。本方法通过整合大规模医学文献、教科书和临床数据,显著提高了大语言模型在医学领域的回答准确性和可解释性。它能够生成包含证据来源的详细回答,有效避免了幻觉问题。本发明为医疗决策支持、医学教育和患者咨询等领域

CN119293179A

用户查询

用户查询

生成查询标签顶层图谱匹配

递归子图匹配

返回相关实体及关系

全局知识图谱

CN119293179A权利要求书1/2页

2

1.一种基于医学图谱的检索增强生成方法,其特征在于,包括以下步骤:

a)医学图谱构建,包括:

-对医学文档进行语义分段,生成语义连贯的文本块;

-从语义块中提取医学实体及其属性;

-构建三层医学知识图谱结构;

-识别实体间关系,创建加权有向图;

-生成图谱摘要标签并合并为全局图谱;

b)基于用户查询进行图谱检索;

c)生成包含证据来源的回答文本。

2.如权利要求1所述的方法,其特征在于,所述语义分段包括以下步骤:

a)使用换行符将文档分隔成初步段落;

b)对每个段落应用命题转移技术,将其转换为一系列自足的陈述或命题;

c)使用大语言模型分析每个命题,决定是否应该将其与现有块合并或创建新的块,该过程使用滑动窗口技术,每次处理5个段落;

d)设置硬阈值,确保每个块不超过预定的上下文长度限制;

e)通过以上步骤生成一系列语义连贯、自包含的文本块。

3.如权利要求1所述的方法,其特征在于,所述医学实体及其属性的提取包括以下步

骤:

a)使用大语言模型分析每个语义块,提取其中的医学实体;

b)对于每个实体,输出实体名称、实体类型和实体描述;

c)实体类型从预定义的专业医学术语列表中选择;

d)对每个块重复进行多次实体提取,以确保提取的完整性和质量;

e)为每个提取的实体分配唯一ID,包含实体来源的文档信息和段落信息。

4.如权利要求1所述的方法,其特征在于,所述三层医学知识图谱结构的构建包括以下步骤:

a)第一层:使用从用户提供的私有文档中提取的实体构建基础图谱;

b)第二层:将第一层的实体链接到由医学教科书和学术文章构建的基础医学知识图谱,使用实体对齐技术进行匹配和链接;

c)第三层:将第二层图谱进一步连接到权威医学资源中的标准医学术语;

d)通过这种分层结构,将特定文档中的医学实体置于更广泛的医学知识背景中。

5.如权利要求1所述的方法,其特征在于,所述实体间关系的识别和加权有向图的创建包括以下步骤:

a)使用大语言模型分析每对相关实体,识别它们之间可能存在的关系;

b)关系类型包括但不限于”是...的症状”、用于治疗、是...的并发症等;

c)对于识别出的每种关系,赋予一个权重值,表示关系的强度或重要性;

d)权重基于关系在文献中出现的频率、模型的置信度等因素确定;

e)将识别出的关系表示为有向边,构建加权有向图,其中节点是医学实体,边是它们之间的关系,边的权重表示关系的强度。

6.如权利要求1所述的方法,其特征在于,所述图谱摘要标签的生成和图谱合并包括以

CN119293179A

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档