基于主题词集语义类型分析.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国中医科学院中医药信息研究所2011年学术年会论文 基于主题词集的语义类型分析 胡雪琴 【摘要】目的:为了减少加工人员在进行中医药学语言系统(TCMLS)加工时的主观错误,本文从主 题词语义类型关联规则挖掘的角度来进行TCMLS语义网络的探索研究。方法:对3.515篇有关“腧穴”临 床文献进行主题词的语义类型提取,采用关联分析的方法对提取到的语义类型进行关联分析。结果:实验 证明基于中医药学主题词表的语义类型关联规则挖掘的结果跟临床文献的实际情况更相近,TCMLS可以考 虑利用该方法来进行扩展研究。 【关键词】中医药学主题词表中医药学语言学系统语义类型 ChineseMedicine 中医药学语言系统(Traditional LanguageSystem,TCMLS)是根据 中医药语言特点及学科体系,按照本体论设计原理,设计而研制的中医药学检索语言集成系 统[1]。TCMLS词库中收录了大量的中医药术语和相关概念,主要来源于受控词表,如《中 国中医药学主题词表》、《中国图书馆分类法》、《医学主题词注释字顺表》(MeSH)及近年来各 种版本的中医药学教科书等[2]。TCMLS在参照一体化医学语言系统(UMLS)的基础上,根据 中医药语言学特点,设计了中医药语义网络,包括126种语义类型与56种语义关系[3]。语 义类型为TCMLS中所有概念提供~种层级目录组织结构,并为每一个概念指定至少一种语义 类型的信息。TCMLS的语义类型分为二大类:实体与事件,并由此展开树形结构。语义关系 则存在于抽象的语义类型或具体的概念之间,用来表达生物医学领域中概念之间的重要关 系。语义类型和语义关系共同构成网状的语义结构,在加工中,加工人员对概念的语义类型 和语义关系的添加具有一定的主观随机性E4]。 TCMLS系统中有部分的概念是来自主题词表,而且主题词表是可扩充的动态性叙词表, 一篇文献中的主题词标引就是一个主题词集合,具有很好的医学语义环境。因此,本文尝试 从主题词集合的角度对TCMLS的语义类型进行扩展研究。 1数据与方法 1.1数据来源 数据来自于中国中医药期刊文献数据库(2006年)年中关于“腧穴”的临床报道文献。中 国中医药期刊文献数据库是中国中医药科学院中医药信息研究所自1984年以来构建的一个 大型中医药文献题录数据库。涵盖了中国国内出版的生物医学及其它相关期刊千余。该数据 ’库采用美国国立医学图书馆的医学主题词注释表》(MESH)及中国中医科学院的《中国中 医药学主题词表》由人工进行规范的主题词标引,而TCMLS目前并未应用到标引中。 首先,在中国中医药期刊文献数据库中采用“限定检索”的方法,检索策略:检索词“穴 位”and精确检索and字段选择“主题词”and年代范围2006年and文献类型:临床文献。 检索到3,515篇有关“腧穴”报道的临床文献。因为本文重点是对文献的主题词进行分析, 并且考虑到副主题词标引比较复杂,所以在实验中本文采取了去掉副主题词、保留主题词的 方法,最后将所有文献的主题词录入到Access2007数据库中。一篇文献包含的主题词为一 条记录,也是一个主题词集合。 1.2语义类型处理 在3,515篇有关“腧穴”报道的临床文献中总共有14,391个主题词,经去重处理后, 与“腧穴”共现的主题词共有2。553个,其中,959个属于TCI肛.S系统中的概念词,552个 为TCMLS系统中的相关概念,剩余l,042个主题词未曾在TOfl.S系统中出现。本文对所有主 题词的语义类型进行统计,对未曾加工的主题词,进行语义类型的人工添加。 I.3语义类型的统计分析 经过对主题词的语义类型加工,得到所有主题词的语义类型,一条记录是一个主题词的 集合,也是一个语义类型集合。由于每条记录中都存在“腧穴”这一语义类型,因此,可以 认为每条记录是与“腧穴”共现的语义类型集合。统计得到结果如表l所示。同时,也统计 了TCMLS系统中所有与“腧穴”相关联的概念词的语义类型,作为系统中与“腧穴”共现的 120 中国中医科学院中医药信息研究所2011年

文档评论(0)

july77 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档