蛋白质组学质谱数据预处理新策略研究及运用.pdfVIP

  • 44
  • 0
  • 约6.2万字
  • 约 56页
  • 2018-06-03 发布于贵州
  • 举报

蛋白质组学质谱数据预处理新策略研究及运用.pdf

蛋白质组学质谱数据预处理新策略研究及运用

摘要 摘要 蛋白质是一切生命活动的执行体,在各种生化反应、控制遗传、新陈代谢、 抵抗疾病等方面起着举足轻重的作用。蛋白质组学研究已成为最重要的生命科 学领域之一,它旨在阐明细胞或者组织内所有表达的蛋白,生物质谱技术在研 究蛋白表达方面发挥着关键作用。由于质谱实验过程中的大量的物理化学噪声、 同位素离子峰、离子碎裂模式可能出现的不规则碎片离子峰和离子缺失、数据 库检索鉴定算法的缺陷等,使得能有效利用的质谱数据只占整个谱峰数据的很 少一部分。因此,必须采取合适的数据的预处理方法和搜索策略及搜索鉴定结 果的优化策略,以提高肽序列鉴定得分,从而提高蛋白鉴定的覆盖率和准确度。 本文对质谱技术所产生的大规模实验数据和理论数据分别进行了预处理。 首先,从理论上分别探讨了半小数规则、色谱保留时间、质谱峰强度、衍生离 子簇信号、碎片离子的完整性以及多肽母离子质量等因素对蛋白质检索鉴定产 生的影响,并提出了利用半小数规则和结合色谱保留时间信息的滤波策略,适 当调整质谱峰强度,完整碎片信息等策略对理论质谱数据及局部实验数据进行 了预处理,从微观层面验证策略的可行性。 由于理论模型是依据理想状况而建立,而实验数据中掺杂了许多不可预测的 影响因素,本文又运用这些策略对大规模实验数据进行了预处理,即从宏观角 度上对以上策略进行了探讨。针对实验数据的差异性,我们又对这些策略加以 组合和优化,通过讨论分析策略中的参数设置和策略的组合方式,得到最优的 方案。比较结果发现,策略组合和优化的方案不仅能提高体系中真实蛋白的鉴 定得分,而且从一定程度上鉴别了伪存蛋白。对简单二蛋白体系的相对鉴定准 确率由33.33%提高到100%;对于复杂度极大的18蛋白体系的相对鉴定准确率 由31.25%提高到了58.82%。 关键词:蛋白质组学,二级质谱,半小数规则,保留时间,母离子扣除,策 略组合优化 ^BS兀L~CT ABSTRACT in the ofalllife avitalroll biochermcal As performer functions,proteinplays anddisease regulating fighting,Proteomies, reaction,geneticcontrolling,metabolism in or beeottleoneofthe whichaimsat all acell illustratingproteins orgamsm,has most realmsoflifescience mass iscrucialto spectrum protein important Biological andchemical ions spectrum,some profiling.Physicalnoises,isotopic anexpeeted andthedeficitsof ionswhichresultedfrom ions dissociation,absent may irregular database

文档评论(0)

1亿VIP精品文档

相关文档