蛋白质结构域预测中的决策模型研究-软件工程专业论文.docxVIP

蛋白质结构域预测中的决策模型研究-软件工程专业论文.docx

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质结构域预测中的决策模型研究-软件工程专业论文

万方数据 万方数据 A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree for the Master of Engineering Research on the Decision Model in the Protein Boundary Prediction Candidate : Ai Ziheng Major : Software Engineering Supervisor : Assoc. Prof. Xue Zhidong Huazhong University of Science and Technology Wuhan 430074, P. R. China January, 2014 独创性声明 本人声明所呈交的 学位论文是我 个人在导师指 导下进行的研 究工 作及 取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含 任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献 的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律 结果由本人承担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本论文属于 保密□, 在 年解密后适用本授权书。 不保密□。 (请在以上方框内打“√”) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 华中科技大学硕士学位论文 华 中 科 技 大 学 硕 士 学 位 论 文 摘 要 结构域是蛋白质的亚单位,可以独立的折叠和发展,结构域是实现蛋白质功能 的最 小 的 结构 单 位 。域 边 界位 置 的 确定 往 往 是对 蛋 白质 功 能 的翻 译的 第 一 步。 ThreaDom 便是一种目的于解决预测域边界而发展出的方法,它与其他方法相比有更高 的精度和召回率。 基于 ThreaDom 的整体思路,在对常见的基于蛋白质序列预测结构域算法进行了 分析与学习,充分了解各个算法的优缺点与适用领域后,单独分析了需要改进的 ThreaDom 方法的相关方面,得出对于一些曲线较为不规则的蛋白质序列,采用固定 阈值的方法准确性较低的结论,继而提出基于机器学习和概率统计的方法,针对包 含这些适配性较低的蛋白质序列的方案进行决策建模。然后利用相关技术方法对特 征的提取、选择和优化,在整个过程当中确定最优的阈值,与此同时,对于相似类 型的序列引入了统计概率的方法进行改善,最后对决策树具体层次路径的调整,以 及对具体阈值的确定做出了详细的介绍。 在算法研究的理论基础上,实现了基于改进 ThreaDom 结果的决策方法,同时对 其进行了全面的测试以及与其他算法的详尽对比。在各种测试条件下的测试结果表 明,该算法具有优于 ThreaDom 预测结构域边界的结果,对 ThreaDom 中曲线较为不 规则的序列具有良好的纠正效果。 关键词:蛋白质结构域 C4.5 算法 决策模型 I II万方数据 II 万方数据 Abstract As the development of biotechnology technology, more and more genomes have been detected the whole structure, which provides large numbers of raw data for scientists. However, only by genomes we can not get known the bio-function of genes and proteins. Actually, most proteins and ORF are unknown for their function. Domain is a subunit of protein, which can also fold and develop independently. To get the accurate edge between domain and domain is usually the first step of declare the function of proteins. And ThreaDom is one of such methods. The article analyses

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档