中医药学语言系统究综述.docVIP

中医药学语言系统究综述.doc

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中医药学语言系统究综述

中医药学语言系统研究综述   摘要:中医药学语言系统(TCMLS)是由中国中医科学院中医药信息研究所联合全国13家中医药科研单位和高等院校于2002年开始研制的大型术语系统。它是在统一医学语言系统(UMLS)的基础上,根据中医药领域的语言特点及学科体系特色,采用本体(ontology)的设计理念和方法研制而成。经过10余年的发展,TCMLS的技术体系日趋成熟,相关研究也越来越深入和系统化。通过回顾TCMLS的发展历程,对相关研究文献进行综述,分析存在的问题和未来的发展方向。 中国论文网 /1/viewhtm  关键词:中医药;语言系统;中医药学语言系统;本体   中医药学经过几千年的发展,在临床实践和医学研究过程中产生了大量的概念和术语。朝代更迭、语言变迁、地域差异、学科融合等多种因素的综合影响,使中医药学术语体系变得极为复杂。针对中医药文本中大量存在的同物异名、同名异物等现象,中医药工作者往往无法做出正确判断。通过建立一个完整、准确的语言系统,能够有效处理词义模糊、一词多义、一义多词等复杂的语言现象,可以解决长期困扰中医药信息化领域的术语使用不规范、术语组织不系统、信息检索效能低下等问题。为此,中国中医科学院中医药信息研究所(以下简称“信息所”)联合全国13家中医药科研单位和高等院校,从2002年开始研制中医药学语言系统(traditional Chinese medicine languagesystem,TCMLS)。本文回顾了TCMLS的发展历程,对相关研究文献进行综述,分析存在的问题和发展方向,为中医药学语言系统的研究、编制和使用人员提供参考。   1概述   TCMLS原名为中医药一体化语言系统。它是参照统一医学语言系统(LMLS),根据中医药领域的语言特点及学科体系特色,采用本体(ontology)的设计理念和方法研制而成的大型术语系统。其目的在于利用现代信息技术,逐步建立规范化的中医药术语体系,从而支持中医药信息资源的合理组织和有效检索。   TCMLS主要包括语义网络(semanticnetwork)和基础词库两大部分。其中,语义网络定义了中医药领域最基本的语义类型(semantictype)和语义关系(semantic relation),构成TCMLS的顶层框架。基础词库则以概念为单位对中医药术语进行系统梳理和准确诠释,建立科学合理的概念分类体系以及概念之间的语义关系。经过10余年的研发,TCMLS的技术体系日趋完善,建立了成熟的术语采集系统;组建了由300多名专家组成的术语加工团队;收录了约12万个概念、30万个术语和127万条语义关系,涵盖了中医药学科体系及与之相关的生物、化工、哲学等学科的专业术语,在文献检索、文本挖掘、术语集成等方面得到了实际应用。   2中医药学语言系统发展历程   从20世纪90年代开始,本体技术在医学领域得到广泛应用,在知识获取、知识管理和信息检索等方面发挥了积极的作用。UMLS是其中的一个代表性本体,它集合了来自100多个词表中的100多万个概念,用于提高计算机“理解”医学信息的能力,促进医学信息系统之间的互操作。注意到UMLS在医学领域取得的成功,中医药工作者开始考虑将本体技术引入中医药领域,以中医药学科为主导且遵循中医药发展思路,研发基于本体的大型术语系统。2002年,信息所联合全国13家单位正式启动了TCMLS的建设工作。TCMLS从建立之初到目前为止,大体经历了3个阶段。   2.1建设初始阶段(2002―2005年)   在建设初期,尹爱宁等提出了建立TCMLS的方法学,制定了TCMLS的技术标准。Zhou XZ等则从信息技术角度提出了TCMLS的技术方案。这些研究为TCMLS的建设给出了科学合理的顶层设计和路线图,为其长期健康发展奠定了基础。在此阶段,各单位加工人员采用单机版的Protege软件分别加工各自的部分,再由信息所统一汇总。这一加工模式促成了多单位数百人协同共建,但所加工的数据难免有所重复和矛盾。   2.2迅速成长阶段(2005―2009年)   从2005年开始,基于万维网(Web)的加工平台成功部署并投入使用。各单位加工人员得以在统一的网络平台上协同共建,免去了数据汇总的环节。基于网络的协作方式显著提升了加工效率,使TCMLS的规模得以迅速增长。但加工人员的主观性和专业水平差异等因素造成TCMLS的数据存在很多质量问题,因此数据质量保证和数据清洗技术成为研究重点之一。在系统建设的同时,学者们也针对系统设计和架构等问题进行了反复研讨,提出了一系列调整和改进方案。   2.3稳定发展阶段(2009―2014年)   经过上一阶段的大规模数据加工,TCMLS已收集了现代中医药文献中出现的大部分概念和术语,其数据增量开始逐年放缓。在

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档