- 1
- 0
- 约2.22万字
- 约 19页
- 2023-06-06 发布于四川
- 举报
本发明提出一种用于不孕不育症临床表型信息的自然语言处理方法及系统,通过自然语言预处理、标点符号拆分、字段拆分法将中文临床表型原始字符串转换为中文和英文临床表型初始字符串、独立字符串和拆分字符串;基于预先建立的中文和英文本体词典,对临床表型初始字符串、独立字符串和拆分字符串进行精确匹配和模糊匹配,经过加权法则,最终输出与中文和英文本体词典匹配的一个或者多个本体。其中,模糊匹配旨在通过语义近似度来计算。本发明同时还提供了自然语言处理系统及介质,包括读取、转换、拆分、匹配和输出模块。本发明解决了中文临
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112765318 A
(43)申请公布日 2021.05.07
(21)申请号 202110072754.8 G06F 40/289 (2020.01)
原创力文档

文档评论(0)