基于EST序列茶代谢网络构建.docVIP

下载本文档

2
0
约4.44千字
约 8页
2018-08-28 发布于福建
举报
版权申诉

基于EST序列茶代谢网络构建.doc

此“经济”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于EST序列茶代谢网络构建

基于EST序列茶代谢网络构建　　摘要：茶树体内的生化反应所生成的各种功能性化合物是茶叶具有营养和健康功能的物质基础，也是茶叶品质的决定因素。这些生化反应由茶树基因编码的酶催化并组成复杂的代谢网络。首先通过开源工具包jsoup开发异步数据采集程序，从布伦瑞克酶数据库（braunschweig enzyme database，简称BRENDA）和美国国立生物技术信息中心（NCBI）网站上获取酶序列及其催化反应、GI号、EC编码对应关系等相关信息，建立本地酶数据库；其次从NCBI上下载FASTA格式的茶树表达序列标签（expressed sequence tag，简称EST）序列数据，通过GI号查询本地酶数据库，得到酶催化反应信息，继而基于超图思想利用Cytoscape Web API重构茶代谢网络；最后对EST序列信息进行统计分析，并从多个维度对构造的代谢网络进行拓扑特性、KEGG路径、生物意义的深入分析，对茶树内生化反应的理解、新功能基因的挖掘、茶叶品质的提升、新茶产品的开发具有重要意义。　　关键词：Cytoscape Web；EST；超图；代谢网络；茶叶　　中图分类号： Q811.4文献标志码： A 　　文章编号：1002-1302（2017）11-0029-04[HS）][HT9.SS] 　　茶是世界上一种重要的饮料[1]。茶叶品质是茶叶具有营养和健康功能的物质基础，其决定因素是茶叶中的各种功能性化合物[2]。研究表明，茶叶中蕴含的活性物质能够促进身体健康和预防多种疾病。比如，茶叶中的多酚类物质有很强的抗氧化性和生理活性，具有很好的抗衰老效果[3]。茶多酚及其氧化物能够吸收放射性物质锶90、钴60，具有一定的抗辐射作用[4]。此外，茶多酚（主要是儿茶素类化合物）具有预防多种器官癌症、代谢综合征、心血管疾病以及神经退行性疾病的作用[5-7]。　　茶叶中的功能性化合物来源于茶树基因编码的酶[8]。酶是代谢反应的生物催化剂，其活性由基因转录和翻译的特定氨基酸序列决定[9-12]。茶叶中的酶促反应组成复杂的生化反应网络，即代谢网络[13]。代谢网络的基本功能是不停地与外界环境进行物质和能量交换，维持茶树体的生命特征[14]。此外，代谢网络对于茶叶中的物质合成至关重要，这些物质是决定茶叶品质和等级的关键要素[15-16]。研究茶叶中的酶及其催化的代谢反应，对于茶树品种的开发、品质的提升、新型茶产品的研发加工具有重要作用。　　茶叶酶的特性取决于氨基酸种类和线性排列，这些氨基酸由茶树基因编码[17]。因此，本研究通过异步数据采集程序从布伦瑞克酶数据库（BRENDA）、美国国立生物技术信息中心（NCBI）网站上获取酶序列及其催化反应、GI号、EC编码等相关信息，建立本地酶数据库；从NCBI上下载茶树表达序列标签（EST）序列数据，通过查询本地酶数据库鉴别出EST序列对应的茶叶酶，继而构造茶代谢网络，从多个维度对构造的代谢网络进行拓扑特性和生物信息统计分析，并讨论分析结果所蕴含的生物学意义。　　1材料与方法　　1.1EST数据采集　　茶树EST序列数据来源于NCBI数据库。在NCBI首页搜索“Camellia sinensis”，选择“protein”，共获得38 619 条FASTA格式的茶树EST氨基酸序列数据。　　1.2酶数据库构建　　酶及其催化反应信息来源于BRENDA[18]。BRENDA中共保存了6 759种酶EC编码、推荐命名和催化反应等信息。由于数据量较大，本研究利用开源工具包jsoup开发异步数据采集程序，解析BRENDA中所有酶及其催化反应的底物和产物等相关信息。对于没有催化反应信息的酶，如EC 1.1.1.5，将其过滤掉，最终共获得5 221个酶及其催化反应数据。EST序列的GI号、酶EC编码对应关系数据也来源于BRENDA。由于NCBI中序列数据会被不断完善和修正，当EST序列信息被更新时，其GI号也将被赋予新值，而BRENDA中保留的仍然是旧的GI号，因此，将会出现1个EC编码可能对应多个GI号的情况。这种情况下，首先判定EST序列数据是否被更新，若被更新，追踪更新历史信息并找到最近的GI号，此过程通过异步数据采集程序自动完成，采集到的数据保存在本地酶数据库中。　　1.3酶基因筛查　　从NCBI上下载的FASTA格式文件的每个序列都有1个GI号作为唯一标识，以便于对序列进行监控和管理[19]。GI号位于FASTA文件序列描述信息的第1行（以“”开始）。通过GI号查询本地酶数据库可以获得酶的EC编码，进而得到酶及其催化反应信息。　　[HTK]1.4代谢网络的构建和可视化[HT] 　　代谢网络的可视化采用Cytoscape Web实现。Cytoscape Web