蛋白质组海量质谱数据的解析及其在人类基因组注释中的应用.docVIP

下载本文档

1
0
约2.95万字
约 36页
2019-06-02 发布于浙江
举报
版权申诉

蛋白质组海量质谱数据的解析及其在人类基因组注释中的应用.doc

1、本文档共36页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

项目名称：蛋白质组海量质谱数据的解析及其在人类基因组注释中的应用首席科学家：刘斯奇中国科学院北京基因组研究所起止年限： 2010年1月-2014年8月依托部门：中国科学院一、研究内容关键科学问题本项目将以我国蛋白质组学界产生的海量MS/MS质谱数据为基本分析材料，重点放在解析这些数据中的新的蛋白质编码基因和蛋白质组定量信息。我们将运用计算化学、工程方法学、生物信息学、质谱学和生物分析化学等研究手段深入探讨如何准确地将MS/MS质谱数据转化为相对应的肽段信息，如何利用这些肽段补充和修订基因组的蛋白质编码基因，如何发掘这些肽段所赋予的定量信息，并建立兼有定性和定量信息的新型蛋白质表达谱。简言之，本项目拟解决的关键科学问题是，如何发掘高精度MS/MS质谱鉴定的肽段中所蕴含的大量生物学信息。主要研究内容海量质谱数据的深度解析技术研究从高精度MS/MS数据出发，通过新一代蛋白质数据库搜索引擎技术、De Novo技术、基因组数据库搜索技术三个途径来实现海量质谱数据的深度解析，具体研究：通过严格的对照实验确定质谱数据可解析率，优化和规范实验操作流程；研究新一代蛋白质鉴定搜索引擎，提高鉴定可信度、灵敏度和速度；综合利用实验、仪器和计算手段发展肽序列De Novo分析技术；利用基因组数据库搜索进一步提高质谱数据解析率。 2．高精度MS/MS数据对基因组蛋白质编码基因的补充和修订采用De Novo方法独立演绎所测定肽段的氨基酸顺序，进一步反转肽段信息至基因组，试图补充和修订基因组的蛋白质编码基因，具体研究：构建综合性蛋白质序列数据库；建立基于肽段信息注释基因组的方法流程；利用MS/MS所鉴定的肽段补充和修订基因组蛋白质编码基因。基于高精度质谱数据的蛋白质表达谱定量计算方法的研究及应用以鉴定的肽段频率为基础，发展兼顾准确度与规模化的非标记定量蛋白质学方法，同时开发以多肽质谱数据为基础的蛋白质编码基因的可视化标识技术，实现蛋白质表达谱的定量化，具体研究：蛋白质表达谱定量算法研究；蛋白质组表达谱定量分析及可视化研究；建立以基因为中心的定量蛋白质数据库及分析平台。基于质谱数据的预测结论的实验验证研究运用质谱学、生物化学、分子生物学和免疫学等手段系统验证基于MS/MS数据所分析的生物信息学结论，同时为生物信息学的理论模型提供严格设计和控制的实验数据，具体研究：建立先进的MRM技术平台实现对蛋白质定性和定量的高通量验证，发现和验证新的蛋白编码基因，并提供相应的定量蛋白质组信息；利用先进的质谱技术平台获取高精度MS/MS数据服务于质谱谱图的深度解析；建立通用技术平台从核酸和蛋白质水平上验证通过MS/MS所鉴定的新基因；建立通用技术平台从不同技术角度上验证定量蛋白质组。二、预期目标 1．总体目标本项目研究的总体目标是，发掘MS/MS数据中的肽段信息，开拓生物信息学在质谱数据分析中的研究领域，促进高精度质谱数据在基因组学和蛋白质组学的应用。本项目将通过高精度MS/MS数据和De Novo方法获取一系列与基因组注释基因不相匹配的肽段，并利用这些信息补充和修订基因组蛋白质编码基因；将采用肽段频率为定量蛋白质组计算的基本数据，通过蛋白质定量参数、数学模型和可视化标示等技术来建立定量蛋白质表达谱，并阐明其生物学意义。通过本项目的执行，我们将显著提高MS/MS数据的利用率，具体回答若干相关的生物学问题，拓展生物信息学应用于蛋白质组学的思路和方法。因此，本项目将促进我国在蛋白质组学、基因组学和生物信息学交叉领域的研究。 2．五年目标 1）发展一套针对高精度MS/MS数据的分析策略以及相应的数据库和计算方法； 2）显著提高海量MS/MS数据的利用率，深入揭示高精度质谱数据所蕴含的物理化学和生物学意义； 3）提升我国在质谱信号解析和蛋白质组生物信息学研究方面的水平。 4）在国际主流杂志发表论文30篇左右，并争取Nature及其它国际知名科学期刊发表10篇论文。申请发明专利5－10项。 5）造就一支生物信息学和蛋白质组领域中的高水平的科研队伍，培养一批博士研究生(10-15人)，硕士研究生(20-25人)，博士后研究人员(5－10人)。三、研究方案 1. 总体学术思路在蛋白质组学诞生的短短几年内，这个学科已经取得了重大进展：蛋白质表达谱的建立，修饰蛋白质的测定，和蛋白质相互作用的分析等。但是，作为一门年轻的学科，蛋白质组的分析技术还远未成熟。其中一个主要的原因是人们在蛋白质鉴定和定量分析上仍遭遇较大的技术困难。近年来，高精度质谱仪的出现给蛋白质组学发展创造了一个新的发展契机。如何深入解析高精度MS/MS数据所蕴含的丰富的生物学信息，是摆在蛋白质组生物信息学面前的重要课题。本项目