- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于序列关联的蛋白质亚细胞定位识别
Hans Journal of Computational Biology 计算生物学, 2011, 1, 1-3
/10.12677/hjcb.2011.11001
Published Online September 2011 (/journal/hjcb/)
Recognition of Subcellular Localization of Proteins Using
of Sequences Fusion
Yun Jia
Department of Physics Experiment, School of Basic Science Inner Mongolia University of Technology, Hohhot
Email: yunbao2004haijun@163.com
Received: Sep. 18th, 2011; revised: Sep. 27th, 2011; accepted: Sep. 29th, 2011.
Abstract: Functional annotation of unknown proteins is a major goal in proteomics. A key annotation is the
prediction of a protein’s subcellular localization. We used the method of Increment of Diversity with Quad-
ratic Discriminant analysis (IDQD) to predict subcellular localization of proteins which are recognized by the
four plant categories and three non-plant and obtained accuracy 87.4(±0.5)% and 91.2(±0.2)%, respectively
in 5-fold cross-validation test. Our result is better than comparable existing methods.
Keywords: Subcellular Localization; F-Value; Quadratic Discriminant Analysis
基于序列关联的蛋白质亚细胞定位识别
贾 芸
内蒙古工业大学理学院物理实验中心,呼和浩特
Email: yunbao2004haijun@163.com
收稿日期:2011年 9月 18日;修回日期:2011年 9月 27日;录用日期:2011年 9月 29日
摘 要:对未知蛋白的功能注释是蛋白质组学的主要目标。一个关键的注释是蛋白质亚细胞定位的预
测。应用基于序列关联的二次判别分析方法进行蛋白质亚细胞定位预测,对 4 个植物定位类型进行
5-fold交叉检验。
关键词:亚细胞定位;F值;二次判别分析
1. 引言
共 4 类 940 个蛋白质序列,包括叶绿体 (chloroplast
transit peptide, cTP),线粒体 (mitochondrial targeting
peptide, mTP),分泌途径(secretory pathway signal pep-
tide, SP)和其它(other, OT)等 4个类别。SP类由内质网
(endoplasmic reticulum, ER),细胞外(extracellular space,
EX),高尔基体(golgi apparatus, GO),溶酶体(lysosome,
LY),质膜(plasma membrane, PM)和液泡(vacuole, VA)
等类别组成.OT类由细胞质和细胞核蛋白组成.各类别
的蛋白序列数详细情况见表 1。
在后基因组时代随着蛋白质序列雪崩式的被测
出,各种基于序列信息的方法被用于预测蛋白质亚细
[1,2]
胞定位识别 。本文作者在研究生学习期间工作的基
础上继续引入了 F值参量结合多样性增量进行二次判
别分析(IDQD) 方法对蛋白质亚细胞定位进行预测获
得了一系列结果。
[3]
2. 数据集与方法
2.1. 数据集
Table 1. The number of protein sequences listed for each dataset
according to localization
[4]
本文使用了与 TargetP 相同的数据集 (http://
表 1. 依据亚细胞定位分类序列数
您可能关注的文档
- 基于ABAQUS的太阳能聚光器结构分析.doc
- 城市转型中的营销策略——广州亚运营销解读.doc
- 基于ALA-PDT中PpIX亚细胞分布位点光漂白实验研究.doc
- 基于ALA-PDT的HL60细胞中活性氧的检测.doc
- 基于ANSYS的家电用永磁同步电动机温度场分析.doc
- 基于A-GPS的全球用户连通系统.doc
- 基于AC均线预测的股票交易策略及实证.doc
- 基于Ansoft的汽车车窗电子开关PCB电磁兼容性的仿真分析.doc
- 基于ANASYS的磁控电抗器场路耦合模型研究.doc
- 基于ANSYS的汽油机曲轴箱强度分析.doc
- 2025年无人机植保农药减量与标准化进程研究报告.docx
- 2025年智能门锁生物识别算法功耗优化技术分析报告.docx
- 2025年新能源太阳能光伏电站运维报告.docx
- 2025年智能母婴用品设计创新及消费体验升级研究报告.docx
- 2025年料酒行业品牌竞争现状与发展趋势.docx
- 湖南省衡阳市重点名校2026届高二物理第一学期期末考试模拟试题含解析.doc
- 2025年逻辑芯片行业应用领域创新与市场拓展策略研究.docx
- 2026届黑龙江省绥化市安达市第七中学物理高二第一学期期末复习检测模拟试题含解析.doc
- 2025年数字孪生在汽车工厂数字孪生平台架构设计.docx
- 2025年新能源远程检测行业市场趋势报告.docx
原创力文档


文档评论(0)