网站大量收购独家精品文档,联系QQ:2885784924

基于机器学习的药物蛋白虚拟筛选方法研究-软件工程专业论文.docxVIP

基于机器学习的药物蛋白虚拟筛选方法研究-软件工程专业论文.docx

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 Classified Index:TP391.4 Dissertation for the Master Degree in Engineering Research on the Virtual Screening of Drug Protein based on the Machine Learning Candidate: WangMengYu Supervisor: QiaoPeiLi Academic Degree Applied for: Master of Engineering Specialty: Software Engineering Date of Oral Examination: March, 2016 University: Harbin University of Science and Technology 哈尔滨理工大学硕士学位论文原创性声明 本人郑重声明:此处所提交的硕士学位论文《基于机器学习的药物蛋白虚 拟筛选方法研究》,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期 间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包 含他人已发表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体, 均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。 作者签名: 日期: 年 月 日 哈尔滨理工大学硕士学位论文使用授权书 《基于机器学习的药物蛋白虚拟筛选方法研究》系本人在哈尔滨理工大学 攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈 尔滨理工大学所有,本论文的研究内容不得以其它单位的名义发表。本人完全 了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关 部门提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学 可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内 容。 本学位论文属于 保密 ,在 年解密后适用授权书。 不保密√ 。 (请在以上相应方框内打√) 作者签名: 导师签名: 日期: 年 日期: 年 月 月 日 日 哈尔滨理工大学工学硕士学位论文 哈尔滨理工大学工学硕士学位论文 基于机器学习的药物蛋白虚拟筛选方法研究 摘 要 20 世纪中后期,伴随计算机技术的迅速发展,新药物的研发进入了一 个新的阶段。在计算机辅助药物设计的众多方法中,基于分子对接的虚拟筛 选由于其较好的普适性,已被大多数机构和制药公司所认可,但同时,这种 策略的准确度很大程度上依赖于打分函数的精度。从目前来看,对于打分函 数的研究还受理论和方法的限制,因此目前仍没有一种完全正确的方法。另 一方面,虚拟筛选的过程中会用到大量的实验室晶体结构,当所要研究的靶 点结构不足以满足虚拟筛选所需的数量时,将不得不加入一些可能包含错误 结果的对接取向或者同源建模数据,从而降低最终筛选结果的准确率。近年 来,由于机器学习技术的不断发展,应用机器学习相关理论来提高虚拟筛选 效果已经成为研究的重点,虽然到目前机器学习算法还无法使计算机具备和 人类一样强大的学习能力,但针对大量特定学习任务的算法的提出,使计算 机具备了从大量数据中提取特征、发现隐含规律的能力,因此机器学习理论 作为一种强力辅助手段,已被引入到计算机辅助药物设计中。 基于这个背景,本文提出一种结合机器学习的策略改进基于分子对接的 虚拟筛选流程,采用蛋白质-配体交互指纹(Interaction Fingerprint,IFP)来编 码蛋白质和其配体之间的交互作用来代替打分函数,采用集成学习的手段降 低因混入错误对接结果对最终筛选结果的影响。本文首先介绍了虚拟筛选的 概念和方法,以及国内外机器学习和虚拟筛选相结合所取得的成果。然后介 绍了基于分子对接的虚拟筛选流程和蛋白质-配体交互指纹的概念和发展。 为了论证所提出方法的有效性,本文选取 SRC 和 Cathepsin K 这两种目前 制药领域的热点药物靶点,并以 SC-PDB 数据库和 PDB 数据库中的相关数 据为基础进行向量化处理,随后采用 BP 神经网络来预测这两种靶蛋白的蛋 白质-配体交互指纹。同时,本文也在朴素 BP 神经网络的基础上,引入遗 传算法和模拟退火算法来解决 BP 神经网络在训练数据中收敛速度过慢和易 陷入局部最优值的问题。在虚拟筛选阶段,本文将采用机器学习算法生成的 IFP 作为分类算法的输入,并模拟实际情况加入部分对接取向。为了解决因 训练集质量不高而导致虚拟筛选效果较低的问题,本文在算法层面引入集成 学习思想,优化了本文所提出的新的虚拟筛选流程。在实验构建与分析部 I - 分,采用 PDB 数据库和

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档