一体化医学语言系统秋检索umlschinese.pptx

一体化医学语言系统秋检索umlschinese.pptx

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

一体化医学语言系统;前言;(1)工作量大。因为其工作繁难,国外的信息检索系统中有75%的运行费用要用于人工标引。

(2)效率低。标引员要正确标引一篇文献,往往要耗时一个半小时以上。

(3)一致性差。美国的Cleverton曾做过一些试验,他指出:两组人为同一主题编出的叙词表,其中词的同一率仅60%。两位有经验的标引员用同一叙词表对同一篇文献进行标引,其标引词的同一率仅有30%左右。两个在同一库中用同一检索系统检索同一问题的人,检索出的结果的同一率仅有40%。两位科研人员根据同一提问判断一组指定文献的相关性,其同一率不会超过60%。;(4)词表的不完备性影响了标引的质量。词表的更新赶不上时代发展的步伐。庞大的词表,使标引速度大大地降低。

(5)标引人员与检索人员都必需熟悉词表才能工作,使用非常不便。因此,必须发展使用电脑来进行自动标引。早在1956年,美国的H.P.Luhn就开始了文献自动标引的试验;60年代初,美国的G.Salton教授在自动标引方面取得了令世界瞩目的成就。

;为实现自动标引与自由检索,以及数据库的深层次加工与数据挖掘。现行方法有两个方面。

数据库结构的拆分与细化。

语言处理。

美国国立医学图书馆研制了统一的医学语言系统其目的在于克服计算机生物医学信息检索中相同的概念具有不同的表达方式,有用的信息分散在不同的数据库系统中。;一、UMLS的建立与发展过程;1986-1988的第一阶段,其研究和开发的重点是调查用户需求、开发研究工具、确定UMLS的性能及其实施方案、界定系统组成等。在此阶段主要界定了UMLS的三个组成部分即超级叙词表、语义网络、情报源图谱,并且进行了包括MeSH、SNOMED、CMIT和PDQ词表在内的联接试验。

1989-1991年为UMLS的发展阶段,其开发的重点是迅速研制和发行三个UMLS产品的试验版,同时继续开展用户调查和UMLS功能开发。

92年至今为应用阶段,1996年UMLS新增了一个组成部分即“专家词典”。在此阶段,许多研究机构利用UMLS进行基于Internet的应用开发,如决策支持系统DXplain、文献检索系统Webmedicine、临床Web搜索系统Clinweb、医学世界检索Medicalworldsearch以及集成化的Medweaver???。;二、UMLS的组成;1.超级叙词表(Metathesaurus)

超级叙词表是UMLS的核心词汇部分,其英文名称“Matethesaurus”的前缀Mate取自《韦伯氏英语词典》对“Mate”前缀的第二种解释,即“更综合,卓越超常”。在多种意义上,超级叙词表的确胜过包揽的特定词表和分类表。超级叙词表是大型的、多词源、多语种的生物医学词库,包括概念、术语、词汇及其等级范畴、属性以及词间关系等。;1.超级叙词表(Metathesaurus)

超级叙词表在收词方面具有如下特点:

(1)收词量大:收录来自100多种生物医学受控词表、术语表、分类表、专家系统中的词汇、词典及工具性词表等,可大致分为以下类型:

①为病案记录系统而设计的各种术语表,如《国际系统医学术语集》(SNOMED);

②用作统计报告和列表的大型疾病和病程分类表,如《国际疾病分类》修订第10版及其他各版;

③用于记录与精神病学、护理、医疗器械、药物副作用等数据有关的专业化词表,如:《精神失常诊断和统计手册》、《护理诊断分类》;

;1.超级叙词表(Metathesaurus)

④专家诊断系统或联机数据库中的疾病及其他可查询术语,如麻省总医院研制开发的DXplain专家诊断系统;

⑤情报检索系统所使用的叙词表,如MeSH表及其葡萄牙语、西班牙语、法语、德语、俄语等各种译本;

⑥医学词典,如《多兰氏图解医学辞典》、《医生现行工作术语》;

⑦工具性词表,如《校对词表》、《校对词表术语的美式英语与超级叙词表概念的等同参照》。

;1.超级叙词表(Metathesaurus)

(2)选择性:超级叙词表对来源词表中的词并不是照单全收,而是选择性收录,对同一种词表的不同版本也是如此。例如,超级叙词表2005年AA版收录了《国际疾病分类(修订第10版)》(ICD-10)的词汇13490个、ICD-10美国版1107个、ICD-10澳大利亚版25588个、ICD-9临床版20176个。

(3)动态性:从2002年开始,超级叙词表进行季度更新,词汇有增有减,但总的趋势在增长。例如,1997年第8版的超级叙词表收录了来源于30多种生物医学词表和分类表的能表达33万多个概念的739439个词汇;2001年1

文档评论(0)

daluobu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档