中医药学语言系统-中医药知识服务平台.pdf

中医药学语言系统-中医药知识服务平台.pdf

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
T CMLS 中医药学语言系统 编写人: 于彤 yutongoracle@ 背景 近年来,网上的信息资源迅速增多。如何快速准确地检索到 所需信息,成为一个重要的问题。 本体和语义网络等技术,可以帮助我们更好地解决信息检索 等问题。 本体 (ONT OLOGY ) 本体是针对领域概念体系的精确规范,用以指明概念的定义 以及概念之间的语义关系。 本体是实现医学术语系统的一种新兴技术,与主题词表和分 类法等传统技术相比,具有逻辑严谨、易于维护,支持推理 等特点。 语义网络 (SEMANT IC NETWORK ) 语义网络是一种常用的本体表示方法,其基本思想是将领域 知识表示为带标签的图,其中节点表示领域概念,边表示概 念之间的语义关系。 语义网络因其简单、灵活、丰富、易读等优点,在计算语言 学、生物学、医学等诸多领域得到广泛应用。 WordNet、UMLS、SNOMED CT等大型术语系统都体现了语义网 络的设计理念。 UMLS 1986年,美国国立医学图书馆建立了 “统一医学语言系统 (Unified Medical Language System,UMLS)”,帮助信息 系统 “理解”生物医学领域的语言。 UMLS Semantic Network:一个医学领域的顶层本体,包含 135个语义类型 (即节点)和54种语义关系 (即节点之间的链 接)。 UMLS Metathesaurus:包含来自100多个词表中的100多万个 概念。 促进医学数据资源的整合以及医学信息系统之间的互操作。 中医药术语的复杂性 中医药学经过几千年的发展,形成了极其复杂的术语体系。 存在大量词义模糊、一词多义、同物异名等现象。 中医药学用语的不规范性,影响了中医药信息检索的效果。 T CMLS 的提出 2002年,中国中医科学院中医药信息研究所联合全国13家中医 药科研院所和大学院校,开始研制 “中医药学语言系统 (Traditional Chinese Medicine Language System, TCMLS)”, 以促进中医药术语规范化。 什么是T CMLS ? 以中医药学科体系为核心,遵循中医药学科 理论体系,建立中国第一个计算机化的、可 持续发展的、包含中医药及其相关学科语言 的中医药学语言集成系统,形成中医药学的 语言系统平台。 什么是T CMLS ? 借鉴UMLS的成功经验和方法学,根据中医药领域术语和知识 的特点进行设计 从标准、教材、辞典、工具书、临床术语选取中医药 领域概念和术语 采用本体 (Ontology)的方法,对中医药的概念和术语进行 系统梳理和精确表达 支持术语集成与规范化、规范化数据库加工、信息检索与查 询、数据挖掘与知识发现 语言学、信息科学与中医药学知识体系的有机结合 T CMLS 的发展阶段 中医药学语言系统的建立到目前为止经过三个阶段的发展: 1. 建设初始阶段 (2002-2005)。 2. 迅速成长阶段 (2005-2010)。 3. 稳定发展阶段 (2010-2014)。 第一阶段,建设初始阶段 (2002-2005 ): 中国中医科学院信息所自2002年起开始研制TCMLS。 制定了TCMLS的技术标准,包括语义网络框架,收词方法和标 准等。 由全国十几家机构的加工人员用Protégé-2000软件分别进行 单机加工,最后由信息所统一汇总。 第二阶段,迅速成长阶段 (2005-2010 ): 系统的建设方法、技术标准等机制建设完善。 TCMLS的收词量迅速增长。 系统中的数据存在很多质量问题,数据清洗成为一项重要任 务。 基于Web的加工工具投入使用,支持异地大规模协作式加工。 第三阶段,稳定发展阶段

文档评论(0)

zhuwo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档