- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HM-SVM的蛋白质相互作用位点预测-生物信息研究组-哈尔滨
* 我将分六部分汇报我的博士论文工作, 下面是报告的主要内容:首先是绪论、介绍课题研究的背景、目的和意义; 然后是我博士论文的主体内容,包括:。 最后是论文的结论 * * 我现在已经做了XX个系统,学术界在使用我的系统,这些系统在功能与性能上不能满足大规模实际产业应用需要,缺少易用的公共支撑的模块。这个项目的主要工作之一就是进行工程化开发。搭建一个服务平台。 * 1---A--首先介绍项目所属的技术及应用领域,项目直接瞄向计算机辅助药物设计,CADD。CADD是指随着基因组学和蛋白质组学的研究,使得可以从分子层面上,通过计算的方式来进行靶蛋白和药物复合物的筛选与设计。靶蛋白是指具有药效功能并能被药物作用的蛋白质。因此从计算机技术角度来讲,会涉及大量分析算法、模型和计算方法。 B--CADD的应用领域越来越多,例如生物、制药等。典型问题包括分子模拟、结构预测等,这些问题都可以通过高性能计算和智能化分析算法预测。。 生物医药产业是国家也是深圳市战略性新兴产业之一,并陆续出台了一系列政策,所以对CADD的需求特别大。 2-----本项目研究的重点是蛋白质结构和功能预测。在海量的分子中,找到可以与靶蛋白在结构和功能上具有可药性的分子。这种关系就像钥匙和锁的关系一样。CADD可以高效精准的找到能开锁的钥匙。 * 相对于传统制药方法,CADD具有极强的优越性,这也是为什么国际领先药厂普遍采用CADD技术进行药物研发。 CADD利用高性能计算、智能分析算法和模型,对海量分子数据进行搜素、筛选、分析、计算,从而大大提高药物设计的性能和精度。(结合图) 由于遍历了全部分子避免了人工基于经验的挑选,所以更加精准。 大范围的产业应用后,计算量大,可以放到超算上用。 * * 基于HM-SVM的蛋白质相互作用位点预测 在混合I数据集上滑动窗口大小对HM-SVM预测结果的影响 * 基于HM-SVM的蛋白质相互作用位点预测 非同源性复合物I数据集上的预测实例。 CRF预测结果 HM-SVM预测结果 ANN预测结果 正确位点 SVM预测结果 * 基于HM-SVM的蛋白质相互作用位点预测 同源性复合物I数据集上的预测实例。 CRF预测结果 HM-SVM预测结果 ANN预测结果 正确位点 SVM预测结果 * 报告内容 蛋白质功能结构预测的意义 蛋白质远程同源性检测 蛋白质相互作用位点预测 DNA结合蛋白识别 DNA结合蛋白识别方法 参考文献: Bin Liu*, Jinghao Xu,? Xun Lan, Ruifeng Xu, Jiyun Zhou, Xiaolong Wang, Kuo-Chen Chou, iDNA-Prot|dis: identifying DNA-binding proteins by incorporating amino acid distance-pairs and reduced alphabet profile into the general pseudo amino acid composition, PLoS ONE (In press) Bin Liu*, Jinghao Xu, Shixi Fan, Ruifeng Xu, Jiyun Zhou, Xiaolong Wang, PseDNA-Pro: DNA-binding Protein Identification by Combining Chou’s PseAAC and Physicochemical Distance Transformation. Molecular Informatics.(In Press) Ruifeng Xu, Jiyun Zhou, Bin Liu*, Lin Yao, Yulan He, Quan Zou and Xiaolong Wang, enDNA-Prot: Identification of DNA-binding Proteins by Applying Ensemble Learning. BioMed Research International, 2014: 294279? * * DNA结合蛋白识别方法 DNA序列 DNA结合蛋白 * 蛋白质相互作用位点研究现状 DNA结合蛋白识别方法 基于序列信息的预测方法 ACC、iDNA-Prot等 基于多序列比对的方法 DNA-binder等 基于结构信息的方法 Gao等人的方法 基于机器学习的预测方法 神经网络、支持向量机、随机森林等 基于氨基酸距离对的蛋白质表示形式 Given a protein sequence consisting of amino acids as formulated by
文档评论(0)