数据挖掘方法用于参与代谢的小分子生物学功能预测研究博士.docxVIP

数据挖掘方法用于参与代谢的小分子生物学功能预测研究博士.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘方法用于参与代谢的小分子生物学功能预测研究博士

中图分类号:Q-31单位代号:10280密级:公开学号士学位论文SHANGHAIUNIVERSITYDOCTORAL DISSERTATION题目数据挖掘方法用于参与代谢的小分子生物学功能预测研究作者彭淳容学科专业材料学导师陆文聪教授完成日期二零一二年五月上海大学本论文经答辩委员会全体委员审查,确认符合上海大学博士学位论文质量要求。答辩委员会主任:姓名:单位:职称:委员:姓名:单位:职称:姓名:单位:职称:姓名:单位:职称:姓名:单位:职称:导师:姓名:单位:职称:答辩日期:年月日原创性声明本人声明:所呈交的论文是本人在导师指导下进行的研究工作。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:日期:本论文使用授权说明本人完全了解上海大学有关保留、使用学位论文的规定,即:学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容。(保密的论文在解密后应遵守此规定)签名:导师签名:日期:上海大学工学博士学位论文数据挖掘方法用于参与代谢的小分子生物学功能预测研究姓名:彭淳容导师:陆文聪教授学科专业:材料学上海大学材料科学与工程学院二零一二年五月A Dissertation Submitted to ShanghaiUniversityfor the Doctor’s Degree in EngineeringResearch on Prediction of Biological Function of Small Molecules in Metabolic Pathway Using Data MiningPh. D. Candidate:Peng ChunrongSupervisor:Prof. Lu WencongMajor:Material ScienceSchool of Material Science and EngineeringShanghaiUniversityMay, 2012摘要小分子是分子量比较小的化合物,可以参与包括代谢反应在内的很多生物过程,据估计,与生物过程有联系的小分子的种类数目至少有10万多个,而迄今为止已搞清楚其生物学功能的尚不足其中的1%。因此,进行小分子的生物学功能识别和预测研究,有助于理解生命过程中一些问题的生物学和化学本质。通过搜集整理小分子生物学功能研究的实验成果,利用数据挖掘方法总结已知数据中隐含的规律,可以预测未知小分子的生物学功能。使用数据挖掘方法进行小分子的生物学功能识别和预测研究,首先要解决的问题就是如何对小分子进行参数表征,这对于数学模型的建立起到至关重要的作用。经过比较现有的商业和开源的分子描述符计算程序,选用了ChemAxon公司的Calculator Plugins等程序,使用Java语言对其进行了二次开发,开发了一个方便易用且可自行定制的批量计算小分子的分子描述符的计算程序。程序极大地提高了小分子的分子描述符计算的便捷性和计算效率,为小分子的生物学功能识别和预测研究提供了高效的工具。正确有效地把具有重要生物学意义的小分子映射到其相对应的代谢途径,将有助于人们更加深入地进行代谢分析,更为深刻地理解小分子的代谢机理。使用ChemAxon公司的JChem for Excel软件批量计算小分子的分子描述符,基于mRMR算法(minimum Redundancy Maximum Relevance)和FFS算法(Feature Forward Search)进行特征选择,采用以C4.5决策树算法为基本分类器的Adaboost算法预测了小分子可能参与的代谢途径的类型。由此所建立模型的10折交叉验证测试和独立测试集测试的预测正确率分别为83.88%和85.23%,与使用官能团组成表征小分子的方法相比,预测结果有了显著的提高。还使用HyperChem软件计算小分子的分子描述符,基于CFS(Correlation-based Feature Subset)算法进行特征选择,采用以最近邻算法为基本分类器的Bagging算法预测了小分子可能参与的脂类代谢的子代谢途径,所建模型对Jackknife交叉验证和独立测试集的预测正确率分别是89.85%和91.46%。在代谢途径中,小分子通过与酶的相互作用,参与了整个代谢过程。研究小分子与酶的相互作用,可以根据已知的“小分子-酶作用对”预测未知的小分子和酶能否相互作用,进而为探索各种代谢或催化机理提供新的研究思路。使用所开发的计算程序的计算结果表征小分子,使用改进的拟氨基酸组成表征酶,对代谢途径中小分子和酶的相互作用进行研究。结合使用mRMR算法、IFS(Incrementa

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档