- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物医学缩略语歧
生物医学缩略语消歧 中文摘要
生物医学缩略语消歧
中文摘要
随着计算机技术和生物技术的进步,当前生物医学领域文献J下在爆炸性增长。文
献中蕴含着最新的研究成果和丰富的生物医学知识。从生物医学文献中自动获取生物
医学知识已经成为生物信息学研究的重要领域。生物医学缩略语消歧在生物医学和自
然语言处理领域有着重要的理论和实践意义,在机器翻译和信息检索领域起着非常重
要的作用。生物医学缩略语在文献中出现形式有两种:一种缩略语与其全称同时出现,
另一种文献中只有缩略语出现。缩略语的出现形式决定了当前缩略语消歧的方法主要
有两种:基于启发式方法,需要构建规则集;另一种是使用统计学和机器学习的方法,
从大量的样本中推导出语言使用模型。
由于生物医学文献的复杂性和多样性,生物医学缩略语在文献中的出现形式亦呈
现出多样性。生物医学缩略语消歧是一个相当困难的任务。本文根据生物医学缩略语
在文献中出现的形式,分别应用基于规则和基于机器学习的方法对生物医学缩略语消
歧进行了深入研究。对于需要消歧的文档,本文首先根据缩略语识别法定位到缩略语;
其次用基于规则和统计的方法对第一种形式的缩略语进行消歧;然后使用缩略语词典
判断是否对此缩略语消歧;若此步没有找到缩略语正确全称,最后进行全局缩略语消
歧。本文通过实验分析证明基于向量空间模型的方法最适用于第二种形式的生物医学
缩略语消歧。
生物医学缩略语消歧实验目前还没有统一的语料,以往研究都是针对文献中缩略
语出现的其一种形式进行消歧,没有形成完善、高效的消歧系统。本文在自己构建语
料的基础上进行实验证明:本文所构建的生物医学缩略语消歧系统,实现了所有形式
的缩略语消歧,并且取得了较高的性能,达到了目前的较好水平。本文的研究和所取
得的成果对今后缩略语消歧研究具有一定的参考价值。
关键词: 生物医学缩略语缩略语识别缩略语消歧启发式方法机器学习
作 者:杨华
指导老师:姚建民
ofBiomedical
DisambiguationAbbreviation
Abstract
With
the
advancementof and amountof
computingtechnology
biotechnology,the
biomedicalliteratureis inail literaturecontainsthelatest
increasingexplosive
speed.The
research andrichbiomedical toextractthe
progress knowledge,how informationfrom
biomedicine
literatureis an researchareainthe
becomingimportant fieldofbioinformatics.
The ofbiomedical
disambiguationabbreviationshasthe tobiomedical
specialsignificance
文档评论(0)