蛋白质组海量质谱数据的解析及其在人类因组注释中的应用.docVIP

  • 7
  • 0
  • 约2.9万字
  • 约 35页
  • 2018-06-24 发布于浙江
  • 举报

蛋白质组海量质谱数据的解析及其在人类因组注释中的应用.doc

蛋白质组海量质谱数据的解析及其在人类因组注释中的应用

一、研究内容 关键科学问题 本项目将以我国蛋白质组学界产生的海量MS/MS质谱数据为基本分析材料,重点放在解析这些数据中的新的蛋白质编码基因和蛋白质组定量信息。我们将运用计算化学、工程方法学、生物信息学、质谱学和生物分析化学等研究手段深入探讨如何准确地将MS/MS质谱数据转化为相对应的肽段信息,如何利用这些肽段补充和修订基因组的蛋白质编码基因,如何发掘这些肽段所赋予的定量信息,并建立兼有定性和定量信息的新型蛋白质表达谱。简言之,本项目拟解决的关键科学问题是,如何发掘高精度MS/MS质谱鉴定的肽段中所蕴含的大量生物学信息。 主要研究内容 海量质谱数据的深度解析技术研究 从高精度MS/MS数据出发,通过新一代蛋白质数据库搜索引擎技术、De Novo技术、基因组数据库搜索技术三个途径来实现海量质谱数据的深度解析,具体研究: 通过严格的对照实验确定质谱数据可解析率,优化和规范实验操作流程; 研究新一代蛋白质鉴定搜索引擎,提高鉴定可信度、灵敏度和速度; 综合利用实验、仪器和计算手段发展肽序列De Novo分析技术; 利用基因组数据库搜索进一步提高质谱数据解析率。 2.高精度MS/MS数据对基因组蛋白质编码基因的补充和修订 采用De Novo方法独立演绎所测定肽段的氨基酸顺序,进一步反转肽段信息至基因组,试图补充和修订基因组的蛋白质编码基因,具体研究: 构建综合性蛋白质序列数据库; 建立基于肽段信息注释基因组的方法流程; 利用MS/MS所鉴定的肽段补充和修订基因组蛋白质编码基因。 基于高精度质谱数据的蛋白质表达谱定量计算方法的研究及应用 以鉴定的肽段频率为基础,发展兼顾准确度与规模化的非标记定量蛋白质学方法,同时开发以多肽质谱数据为基础的蛋白质编码基因的可视化标识技术,实现蛋白质表达谱的定量化,具体研究: 蛋白质表达谱定量算法研究; 蛋白质组表达谱定量分析及可视化研究; 建立以基因为中心的定量蛋白质数据库及分析平台。 基于质谱数据的预测结论的实验验证研究 运用质谱学、生物化学、分子生物学和免疫学等手段系统验证基于MS/MS数据所分析的生物信息学结论,同时为生物信息学的理论模型提供严格设计和控制的实验数据,具体研究: 建立先进的MRM技术平台实现对蛋白质定性和定量的高通量验证,发现和验证新的蛋白编码基因,并提供相应的定量蛋白质组信息; 利用先进的质谱技术平台获取高精度MS/MS数据服务于质谱谱图的深度解析; 建立通用技术平台从核酸和蛋白质水平上验证通过MS/MS所鉴定的新基因; 建立通用技术平台从不同技术角度上验证定量蛋白质组。 二、预期目标 1.总体目标 本项目研究的总体目标是,发掘MS/MS数据中的肽段信息,开拓生物信息学在质谱数据分析中的研究领域,促进高精度质谱数据在基因组学和蛋白质组学的应用。本项目将通过高精度MS/MS数据和De Novo方法获取一系列与基因组注释基因不相匹配的肽段,并利用这些信息补充和修订基因组蛋白质编码基因;将采用肽段频率为定量蛋白质组计算的基本数据,通过蛋白质定量参数、数学模型和可视化标示等技术来建立定量蛋白质表达谱,并阐明其生物学意义。通过本项目的执行,我们将显著提高MS/MS数据的利用率,具体回答若干相关的生物学问题,拓展生物信息学应用于蛋白质组学的思路和方法。因此,本项目将促进我国在蛋白质组学、基因组学和生物信息学交叉领域的研究。 2.五年目标 1)发展一套针对高精度MS/MS数据的分析策略以及相应的数据库和计算方法; 2)显著提高海量MS/MS数据的利用率,深入揭示高精度质谱数据所蕴含的物理化学和生物学意义; 3)提升我国在质谱信号解析和蛋白质组生物信息学研究方面的水平。 4)在国际主流杂志发表论文30篇左右,并争取Nature及其它国际知名科学期刊发表10篇论文。申请发明专利5-10项。 5)造就一支生物信息学和蛋白质组领域中的高水平的科研队伍,培养一批博士研究生(10-15人),硕士研究生(20-25人),博士后研究人员(5-10人)。 三、研究方案 1. 总体学术思路 在蛋白质组学诞生的短短几年内,这个学科已经取得了重大进展:蛋白质表达谱的建立,修饰蛋白质的测定,和蛋白质相互作用的分析等。但是,作为一门年轻的学科,蛋白质组的分析技术还远未成熟。其中一个主要的原因是人们在蛋白质鉴定和定量分析上仍遭遇较大的技术困难。近年来,高精度质谱仪的出现给蛋白质组学发展创造了一个新的发展契机。如何深入解析高精度MS/MS数据所蕴含的丰富的生物学信息,是摆在蛋白质组生物信息学面前的重要课题。本项目立足于我国蛋白质组学界已产生的海量MS/MS数据,运用一系列的计算化学和生物信息学的方法,试图发展一套针对高精度MS/MS数据的分析策略以及相应的数据库和计算方法;并以此为基础集中解决两个在

文档评论(0)

1亿VIP精品文档

相关文档