- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于UMLS的医学资源库语义扩展检索系统架构.doc
基于UMLS的医学资源库语义扩展检索系统架构
摘要:基于UMLS的医学资源库的搜索模块通过将搜索关键词的映射到UMLS超级叙词表中相关概念的词串,经过“OR”运算,进行语义扩展的搜索。可以提高查准率和查全率。可以使用MetaMap映射工具,也可以直接访问超级叙词表;可以采用本地数据访问和使用WEB服务两种方式的系统架构来访问UMLS。
关键词:UMLS;资源库;语义扩展;搜索
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)01-0163-03
1 医学资源库的知识组织及检索的不足
在医学资源库中,资源以视频、音频、动画、文档、PPT、积件等多媒体形式存在。资源入库必须以人工标注的方式进行元数据标注。传统的医学资源库的资源检索采用的是关键词匹配。有的检索系统会在关键词匹配的基础上增加类别限制、时间限制、作者限制等范围限制来提高搜索的精确性。但是语言常常具有多义性、同义性、模糊性,比如Aspirin(阿司匹林)和Acetylsalicylic acid(乙酰水杨酸)、Cancer(癌症)和Malignant of neoplasm(恶性肿瘤)、Scar(伤疤)和Cicatrix(疤痕)分别都是同义词,但是各自都是完全不同的关键词。所以按照关键词搜索不可避免的会影响搜索的查全率和查准率。
在生物医学领域中,名词和术语比较多,一词多义现象和多词一义现象很多。除此之外,还有大量的术语之间的语义联系,比如词的上下位关系,关联关系,难以通过关键词搜索表现出来。所以,在搜索模块中,有必要引入一个生物医学领域统一的可控术语表,进行语义扩展的搜索。
2 UMLS(一体化医学语言系统)及其语义网络介绍
一体化医学语言系统 (Unified Medical Language System,UMLS),由美国国立医学图书馆(NLM)研制并维护。UMLS是生物医学概念所构成的一部广泛全面的叙词表和本体,是对生物医学科学领域内许多受控词表的一部纲目式汇编。UMLS提供的是一种位于这些词表之间的映射结构,使这些不同的术语系统之间能够彼此转换。 UMLS主要由超级叙词表、语义网络、专家词典三个组件构成。
超级叙词表是UMLS的基础。是由来自各种受控词表的概念和术语以及它们之间的关系所构成的集合; 超级叙词表中收录100多万个生物医学概念和500多万个概念名称。概念源自UMLS收录的100多部受控词表和分类系统。
超级叙词表之中的每个概念都指定有至少一种“语义类型(Semantic type)”。某些“语义关系”可以存在于多种语义类型的成员之间。语义网络正是这些语义类型和语义关系所构成的一种网络式目录。这是一种相当宽泛的分类;目前,其中共计有135种语义类型和54种语义关系。
3 基于UMLS的医学资源库语义搜索系统架构
利用UMLS做语义扩展恰好能弥补资源搜索中关键词匹配种种局限。因此,该文设想在医学资源库的搜索模块中将UMLS的超级叙词表作为搜索模块的后控词表。UMLS本身提供了SKR(语义知识表达)工具,可以以交互模式和批处理模式两种进行自然语言处理。其中,MTI (Medical Text Indexer)可以进行文章的自动标引;MetaMap用来将自由词映射到UMLS超级叙词表中的词汇;SemRep用来提取生物词汇和短语中的语义类型。UMLS提供了WEB API来访问这三个工具,也可以下载这些工具的安装程序本地安装使用。在这些工具中,MetaMap是SKR工具的核心,可以作为用户和超级叙词表之间的桥梁。
除了上述工具以外,UMLS的超级叙词表和语义网络中的数据可以通过两种方式直接访问,一种是安装MetamophorSys程序,同时将词表文件及语义关系文件下载到本地,导入到MySQL数据库或者Oracle数据库,使用UMLS提供的JAVA API进行本地访问;另一种是通过SOA服务访问,UMLS提供了WEB服务访问的接口,可以使用JAVA API基于WEB服务接口访问,实现基于服务的系统架构。
综合以上分析,基于UMLS的医学资源库的搜索模块可以有四种形式的架构:(1)下载安装MetaMap映射工具,使用JAVA API访问本地MetaMap程序来使用超级叙词表;(2)使用WEB API访问MetaMap WEB服务来使用超级叙词表;(3)安装MetamophorSys程序,使用JAVA API直接访问超级叙词表;(4)使用美国国立图书馆提供的WEB API直接访问UMLS的WEB服务。。该文以使用MetaMap映射工具为例给出基于UMLS的搜索的流程,如图1所示。
4 基于UMLS的搜索效果分析
下面对基于UMLS的
您可能关注的文档
- 基于NFC技术的生产管理系统的设计与实现.doc
- 基于Non—Fourier导热模型的多芯片组件基板热分析研究.doc
- 基于nRF24L01的无线传感器网络节点设计.doc
- 基于OAuth2.0的单点登录系统.doc
- 基于OLS和GWR模型的区域土地适宜性模拟研究.doc
- 基于OneSearch统一检索系统的统一检索平台评价.doc
- 基于OPENCV平台的运动物体跟踪与轨迹生成研究.doc
- 基于Oracle数据库安全策略研究.doc
- 基于Oracle数据库的备份和恢复分析.doc
- 基于Oracle的OLTP与OLAP数据库内存设计和优化.doc
- 场地脚手架工程施工方案(3篇).docx
- 2024年浙江省丽水市松阳县玉岩镇招聘社区工作者真题及参考答案详解一套.docx
- 2024年河南省郑州市惠济区古荥镇招聘社区工作者真题及答案详解一套.docx
- 2024年浙江省杭州市淳安县文昌镇招聘社区工作者真题及完整答案详解1套.docx
- 2024年浙江省台州市三门县小雄镇招聘社区工作者真题带答案详解.docx
- 2024年浙江省宁波市余姚市河姆渡镇招聘社区工作者真题及完整答案详解1套.docx
- 2024年浙江省丽水市景宁畲族自治县雁溪乡招聘社区工作者真题及答案详解一套.docx
- 2024年浙江省杭州市临安市板桥乡招聘社区工作者真题及答案详解一套.docx
- 2024年湖北省宜昌市点军区土城乡招聘社区工作者真题及答案详解一套.docx
- 2024年浙江省台州市路桥区桐屿街道招聘社区工作者真题附答案详解.docx
最近下载
- 煤矿一通三防PPT课件.pptx VIP
- 误吸预防与护理课件(1).pptx VIP
- 深圳清华实验学校语文新初一分班试卷.doc VIP
- 系列电动缸内容简介2特点规格产品手册18942et.pdf VIP
- 风湿免疫学课件.pptx VIP
- JVC摄像机EX-A10UF用户手册.pdf
- 高中数学 第一章 常用逻辑用语 1.3 充分条件、必要条件与命题的四种形式 1.3.1 推出与充分条件、必要条件课件 新人教B版选修1-1课件.ppt VIP
- 深圳清华实验学校新初一分班语文试卷.doc VIP
- 心肺复苏操作培训课件.ppt VIP
- 2025年高考复习之小题狂练(语言文字运用):语用2(30题).doc VIP
文档评论(0)