质和原核生物、真核生物蛋白质的亚细胞定位预测研究-附件2.docVIP

质和原核生物、真核生物蛋白质的亚细胞定位预测研究-附件2.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
质和原核生物、真核生物蛋白质的亚细胞定位预测研究-附件2.doc

附件2 论文中英文摘要格式 作者姓名: 陈颖丽 论文题目: 细胞凋亡蛋白质和原核生物、真核生物蛋白质的亚细胞定位预测研究 作者简介: 陈颖丽,女,1974年8月出生,2002年9月师从于内蒙古大学李前忠教授,于2007年7月获博士学位。 中 文 摘 要 随着人类基因组计划的顺利实施,越来越多的蛋白质序列被测定出来,而对蛋白质结构和功能的认识却远落后于序列的测定。由于蛋白质所处亚细胞的位置与其在细胞中行使的功能密切相关,因此,研究蛋白质的亚细胞定位是研究蛋白质功能的一个重要的手段。由于通过实验手段确定蛋白质的亚细胞定位既耗时,成本又高,且实验中可能还会遇到一些目前无法解决的困难,因此探索利用理论及计算的方法来得到蛋白质亚细胞定位的信息就变得越来越重要,这一工作已成为当前研究的热点。 本文从功能分类和生物分类的两种角度,研究了细胞凋亡蛋白质和原核生物、真核生物蛋白质的亚细胞定位预测问题,原核生物中重点以革兰氏阴性菌蛋白质为研究对象。论文的主要研究结果如下: 1. 在最小离散增量预测算法(ID)的基础上,提出两种新的组合预测算法-离散增量融合算法(IDF)和离散增量结合支持向量机算法(ID_SVM),并首次应用到细胞凋亡蛋白质的亚细胞定位预测上,针对已有的两个细胞凋亡蛋白质测试数据集与SVM算法的结果进行了分析比较,结果显示,我们的算法可以实现比以往方法更高的预测成功率。 2. 鉴于目前存在的细胞凋亡蛋白质数据集所包含的序列数和亚细胞类别都较少的情况,我们构建了一个新的数据集,扩大了细胞凋亡蛋白质的序列数和亚细胞类别。分别采用IDF、SVM和ID_SVM三种算法进行了亚细胞定位预测,均取得了较好的预测效果。 3. 提出一种新的蛋白质序列特征提取方法-氨基酸序列的亲疏水性分布特征提取法,并与N端信号肽序列的二肽组分特征、C端序列的二肽组分特征整合起来形成Hybrid特征提取法,结合IDF、SVM和ID_SVM三种算法构成不同的预测系统,对细胞凋亡蛋白质的亚细胞定位进行预测研究。结果表明,整合了三种信息的Hybrid特征提取法其预测能力均好于单特征提取法,Jackknife检验下其总体预测成功率比氨基酸组成成分特征提取法最大可提高35.7%。 4. 首次将ID算法和IDF算法应用到革兰氏阴性菌的蛋白质亚细胞定位预测中,针对目前研究者普遍使用的两个数据集(Gram_Data1和Gram_Data2)进行了研究。从数据集的蛋白质序列中构建了多种特征参数集,分析了单特征集和多特征组合模式对预测结果的影响,结果表明,间隔氨基酸残基对组成、N端序列的二肽组分和氨基酸序列的组成分布三种特征整合后能够有效地提高革兰氏阴性菌蛋白质亚细胞定位的预测成功率,Jackknife检验下其总体预测成功率比氨基酸组成成分特征提取法可提高11.1%。 5. 将ID算法和IDF算法首次应用到原核生物和真核生物的蛋白质亚细胞定位数据集中,基于氨基酸序列的亲疏水分布、氨基酸组分和二肽组分特征提取法,讨论了单特征提取方法和多特征组合提取方法对原核生物和真核生物蛋白质亚细胞定位的影响。以原核生物的蛋白质数据集为例,与其它算法进行了比较,发现我们的算法在预测Extracellular类蛋白时能给出更好的预测效果。 6. 文中还对不同数据集蛋白质N端序列截取残基长度、氨基酸序列的亲疏水分布的分段数目P和氨基酸组成分布的分段数目P的选取进行了初步探讨亚细胞定位;细胞凋亡;离散增量支持向量机特征提取亲疏水分布革兰氏阴性菌A Study on the Prediction of the Subcellular Location of Apoptosis Proteins, Prokaryotic and Eukaryotic Proteins Chen Yingli ABSTRACT With the success of human genome project, a widening gap appears between rapidly increasing known protein sequences and slow accumulation of known protein structures and functions. The knowledge of the subcellular location of a protein is important to understand its function. Determination of protein subcellular location purely using experimental approaches is time-consuming and expensive. Thus, the th

文档评论(0)

docindpp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档