基于序列关联的蛋白质亚细胞定位识别.docVIP

基于序列关联的蛋白质亚细胞定位识别.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于序列关联的蛋白质亚细胞定位识别

Hans Journal of Computational Biology 计算生物学, 2011, 1, 1-3 /10.12677/hjcb.2011.11001 Published Online September 2011 (/journal/hjcb/) Recognition of Subcellular Localization of Proteins Using of Sequences Fusion Yun Jia Department of Physics Experiment, School of Basic Science Inner Mongolia University of Technology, Hohhot Email: yunbao2004haijun@163.com Received: Sep. 18th, 2011; revised: Sep. 27th, 2011; accepted: Sep. 29th, 2011. Abstract: Functional annotation of unknown proteins is a major goal in proteomics. A key annotation is the prediction of a protein’s subcellular localization. We used the method of Increment of Diversity with Quad- ratic Discriminant analysis (IDQD) to predict subcellular localization of proteins which are recognized by the four plant categories and three non-plant and obtained accuracy 87.4(±0.5)% and 91.2(±0.2)%, respectively in 5-fold cross-validation test. Our result is better than comparable existing methods. Keywords: Subcellular Localization; F-Value; Quadratic Discriminant Analysis 基于序列关联的蛋白质亚细胞定位识别 贾 芸 内蒙古工业大学理学院物理实验中心,呼和浩特 Email: yunbao2004haijun@163.com 收稿日期:2011年 9月 18日;修回日期:2011年 9月 27日;录用日期:2011年 9月 29日 摘 要:对未知蛋白的功能注释是蛋白质组学的主要目标。一个关键的注释是蛋白质亚细胞定位的预 测。应用基于序列关联的二次判别分析方法进行蛋白质亚细胞定位预测,对 4 个植物定位类型进行 5-fold交叉检验。 关键词:亚细胞定位;F值;二次判别分析 1. 引言 共 4 类 940 个蛋白质序列,包括叶绿体 (chloroplast transit peptide, cTP),线粒体 (mitochondrial targeting peptide, mTP),分泌途径(secretory pathway signal pep- tide, SP)和其它(other, OT)等 4个类别。SP类由内质网 (endoplasmic reticulum, ER),细胞外(extracellular space, EX),高尔基体(golgi apparatus, GO),溶酶体(lysosome, LY),质膜(plasma membrane, PM)和液泡(vacuole, VA) 等类别组成.OT类由细胞质和细胞核蛋白组成.各类别 的蛋白序列数详细情况见表 1。 在后基因组时代随着蛋白质序列雪崩式的被测 出,各种基于序列信息的方法被用于预测蛋白质亚细 [1,2] 胞定位识别 。本文作者在研究生学习期间工作的基 础上继续引入了 F值参量结合多样性增量进行二次判 别分析(IDQD) 方法对蛋白质亚细胞定位进行预测获 得了一系列结果。 [3] 2. 数据集与方法 2.1. 数据集 Table 1. The number of protein sequences listed for each dataset according to localization [4] 本文使用了与 TargetP 相同的数据集 (http:// 表 1. 依据亚细胞定位分类序列数

文档评论(0)

qianqiana + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5132241303000003

1亿VIP精品文档

相关文档