基于PubMed摘要的神经肽信息提取系统的设计和实现.pdfVIP

基于PubMed摘要的神经肽信息提取系统的设计和实现.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密□, 在 年解密后适用本授权书。 本论文属于 不保密□ 。 (请在以上方框内打“√” ) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 万方数据 华 中 科 技 大 学 硕 士 学 位 论 文 摘 要 当前,神经科学是生命科学研究中最引人瞩目的学科研究之一,而神经肽在神 经科学中又是近年来进展最快的一个前沿领域,随着分子生物学技术的进展,神经 肽的研究更是突飞猛进。神经肽不仅存在于神经系统,在全身各系统也广泛存在, 对各种生理功能起着重要的调控作用,而目前神经肽信息散步在海量的文献之中, 生物学者们研究起来很不方便,需要对这些神经肽信息搜集,而搜集的第一步就是 在指数级增长的文献中提取出神经肽信息,因此对神经肽信息提取技术的研究具有 重要意义。 在对现有神经肽数据摘要文本进行深入分析后设计和实现了一个在线神经肽信 息抽取系统。该系统核心功能模块主要包括三部分:肽序列的识别与提取、神经肽 名字的识别、神经肽名字及肽序列匹配度评分预测。首先通过研究大量生物文本的 肽序列构成特点,设计并实现识别和抽取肽序列的方法,其中对单字符序列比较难 处理的情况作了缩写判断和统计预测。其次从现有几大数据库中提取已人工收录的 神经肽名字,并通过分析构词、词缀特征等对这些名字重新组合,生成了以正则表 达式为主的现有神经肽名字词典。接着在神经肽名字及序列的匹配度评分预测设计 中,针对摘要数据的特征,抽取了一组带有规则序的有效规则集并根据自然语言的 特性设计一组评分公式,其中对打分函数中的参数设计意义进行了解释,最后利用 统计得到的先验知识对分数进行修正。 通过设计的实验和实验结果证明评分预测核心功能模块性能良好,而且系统性 能也能满足实际需求。 关键词:神经肽 肽序列 信息抽取 规则 统计 I 万方数据 华 中 科 技 大 学 硕 士 学 位 论 文 Abstract Currently, neuroscience research is one of the most remarkable discipline in life science research, and neuropep

文档评论(0)

seunk + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档