- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于生物质谱数据鉴定单核苷酸变异的生物信息学方法.doc
基于生物质谱数据鉴定单核苷酸变异的生物信息学方法
在肽段鉴定领域,图谱库搜索是一种有望取代序列数据库搜索的鉴定策略,下面是小编搜集整理的一篇探究生物质谱数据鉴定单核苷酸变异的论文范文,欢迎阅读参考。
前言
单核苷酸变异(singlenucleotidevariations,SNVs)是由DNA序列上单个碱基变异产生的,包括碱基的缺失、插入、转换及颠换等.SNVs是基因组序列变异的主要形式[1],同时也是生物体生理和病理变异的遗传基础[2].从遗传学的角度看,SNVs既可以存在于具有遗传性的生殖细胞中,也可以存在于不具有遗传性的体细胞中.其中,只有位于基因编码区的SNVs能够影响蛋白的编码.位于编码区的SNVs可以分为3类:(ⅰ)同义SNVs,不改变相应的氨基酸种类;(ⅱ)无义SNVs,突变成为终止密码子,提早结束编码;(ⅲ)非同义SNVs(nonsynonymousSNVs,nsSNVs),改变氨基酸的种类.nsSNVs能够改变蛋白的结构、功能、表达以及亚细胞定位等[3],进而对多种遗传性的特征、疾病以及癌症等产生影响[4~9],如人类耳垢的类型[6]、腋窝的气味[7]、癌症与肿瘤的发生[8]、阿尔茨海默病[9]以及镰刀形红细胞贫血症[10]等.
因此,对SNVs展开研究可以揭示出基因与表型多样性和基因与疾病间的关系,并且有可能研发出治疗疾病的新方法.目前,全基因组关联研究(genome-inoacidvariations,SAVs),因此SAVs是SNVs在蛋白水平上的表现.对SAVs的研究,有助于了解基因型与表型间的关系,进而从本质上了解基因是怎样在蛋白水平上影响生物体的生命过程的[14].目前,基于串联质谱的鸟枪法蛋白质组学(shotgunproteomics)技术由于其自动化、高通量、高灵敏度和高分辨率等特点,已成为大规模蛋白质研究的主要方法.序列数据库搜索算法由于具有较高的可靠性以及灵敏度而成为当今鸟枪法蛋白质组学中蛋白鉴定的主要生物信息学方法.然而,通常蛋白质数据库在构建时为了减小数据库的冗余程度,往往有意压缩对SAVs信息的收录(如Sodifications,PTMs)鉴定[18]相同的方法,这是因为肽段的突变和修饰在质谱图中的表现都是质量迁移,如甲硫氨酸(Met)氧化与丙氨酸(Ala)突变为丝氨酸(Ser)在质量上都是增加16Da[19],所以鉴定PTMs的算法和流程通常也能够鉴定SAVs(如Bonanza算法[20]).虽然PTMs和SAVs的质谱鉴定方法非常相似,但由于其来源上的差别,在实际的鉴定策略中有所不同.(ⅰ)PTMs的种类远比SAVs要多,鉴定PTMs所需的搜索空间一般会比鉴定SAVs所需的大,在质量控制方面具有更大的挑战;(ⅱ)蛋白水平的SAVs大部分是从基因组或转录组延续过来的,充分利用SNVs的数据能大大降低搜索空间,从而得到更可靠的结果.因此在计算方法与策略方面,SAVs和PTMs的鉴定具有一定的相似性,也有其独有的特点.
本文从序列数据库搜索算法、序列标签搜索算法以及图谱库搜索算法3个大方面,详细地介绍了目前基于生物质谱数据鉴定SAVs的各种生物信息学方法,并分析了各种突变鉴定方法的不足之处,最后介绍了基于生物质谱的SAVs鉴定研究现状及其发展方向.
1、氨基酸突变鉴定的算法
当前基于生物质谱的SAVs鉴定算法都是由常规鉴定算法改进而来的,因此根据常规串联质谱鉴定算法中对数据库的依赖程度以及使用的数据库种类,可以将基于生物质谱的SAVs鉴定算法分为3大类(表1):(ⅰ)完全依赖序列数据库的搜索算法,即基于序列数据库搜索的氨基酸突变鉴定算法.此算法利用前体离子质量从序列数据库中筛选出候选肽段,然后将候选肽段的理论图谱与目标图谱进行比对,从而鉴定出样品中的突变肽段;(ⅱ)将从头测序算法(denovo)与序列比对结合的算法,即基于序列标签的氨基酸突变鉴定算法.此算法首先通过denovo测序算法推导出目标图谱中的肽序列标签(peptidesequencetags,PSTs),然后利用PSTs过滤数据库筛选出候选肽段,最后结合PSTs对理论谱图与目标图谱进行比较打分,从而鉴定出样品中的突变肽段;(ⅲ)依赖于图谱库的搜索算法,即基于图谱库的氨基酸突变鉴定算法.此算法将实验图谱与图谱库中的一致性图谱进行比对,从而鉴定出样品中的突变肽段.这3类方法和策略在实施过程中各有其优劣(表1),相互之间暂无法替代,因此在不同的目的下各有其适用性.
1.1基于序列数据库搜索的氨基酸突变鉴定算法
基于序列数据库搜索的氨基酸突变鉴定算法,根据不同的数据库构建方法可以细分为3类:(ⅰ)基于穷举法的氨基酸突变鉴定算法,即通过枚举数据库中氨基酸残基的所有可能突变种类进行突变肽段的鉴定;
文档评论(0)