- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因组规模代谢网络模型的自动化重构研究柴文平1薛卫2张梁1石.doc
PAGE
基金项目:江苏省自然科学基金(BK2012363,BK2011153)
作者简介:柴文平(1987-),女,河北邯郸人,微生物学硕士。Email:chaiwenping88@126.com
*通讯作者:张梁(1978-),男,江苏无锡人,工学博士,教授,主要从事代谢工程研究。Email: zhangl@
基因组规模代谢网络模型的自动化重构研究
柴文平1 薛卫2 张梁*1 石贵阳1
(1. 江南大学粮食发酵工艺与技术国家工程实验室 江苏 无锡 214122
2. 南京农业大学信息科学技术学院 江苏 南京 210095)
摘 要:本研究对基于KEGG在线数据库、Uniprot-MetaCyc数据库以及同源比对三种构建基因组规模代谢网络模型的方法进行了自动化研究。同时提出了基于反应式字符频度直方图的马氏距离比对算法,并应用于模型整合和模型核心反应的识别。上述自动化方法的研究均在树干毕赤酵母基因组规模代谢网络重构过程中得到运用实施,对于提高模型构建效率意义重大。
关键词:基因组规模;代谢网络;自动化重构;直方图
中图分类号:TP391;Q939
随着物种基因组测序的完成以及大量生物学数据的产生,系统生物学研究技术也日益成熟。系统生物学能够模拟和推测复杂生物体行为,其中网络模型模拟是最主要的模拟方法 [1,2]。系统生物学的网络模型种类包含代谢网络[3]、转录调控网络[4]、信号转导网络[5]和转录翻译网络[6]等。而其中的基因组规模代谢网络模型(Genome Scale Metabolic Model, GSMM)已经成为系统生物学不可或缺的研究工具。它通过整合基因组学、文献组学、蛋白组学等组学数据,建立由基因-蛋白-生化反应(G-P-R)关联组成的特定生物代谢网络,是从全局深刻理解其生理特性与定向调控工业微生物生理功能的重要平台[7]。
截止到2013年11月,已经公布了98个生物全基因组代谢网络模型(其中细菌65个,古细菌6个,真核28个)[8]。而GOLD数据库公布的已完成测序物种包含2698个(其中细菌2384个,古细菌163个,真核151个)[9]。前者数量远远小于后者,造成这种情况的原因除了对很多物种生理生化机制了解较少之外,更重要的是重构代谢网络过程需要大量人工工作,非常耗时耗力[10]。虽然已经出现了一些通过自动获取信???初步重构网络的软件平台,如SEED服务器与GEM System软件等[11-13],但其中仍然需要大量的人工操作与修正工作,如SEED注释的基因序列需要人工进行同NCBI注释的基因序列相保持一致,以便后续其他构建方法的补充与修正。此外,大量生物信息学数据库的出现也对进一步实现网络自动化重构提出了挑战。因此,代谢网络重构的自动化研究成为推动代谢网络发展的重大问题。
本文以构建树干毕赤酵母(Scheffersomyces stipitis 或者 Pichia stipitis) [14-15] CBS 6054的基因组规模代谢网络模型为例,以简单、面向对象的Java语言为基础对代谢网络自动化重构的方法进行了研究,提出了一种基于KEGG在线数据库来自动化构建初模型的方法,并对基于Uniprot-MetaCyc本地数据库以及亲缘物种同源比对构建初模型的方法以及整合过程进行了自动化研究,达到代谢网络模型构建的最大程度自动化。自动重构流程如图1所示:
图1 模型自动重构流程
Fig.1 The process of the auto-reconstruction of model1 代谢网络自动重构
基因组规模代谢网络模型构建过程主要涉及[16]:(1)初模型反应列表的获得;(2)模型精细化;(3)转换数学模型;(4)模拟与应用。一般认为构建出G-P-R反应列表就等于完成了代谢网络的初模型[10]。虽然构建G-P-R反应列表过程比较容易理解,但由于基因组规模的大量生物信息学数据涌现,反应列表的构建反而成为构建过程中最繁琐耗时耗力的一部分[17]。所以通过借助计算机技术来达到高效构建反应列表,提高代谢网络模型构建效率的作用。
KEGG(Kyoto Encyclopedia of Genes and Genomes)与MetaCyc ( HYPERLINK / /)是模型构建中最常用的网络数据库,包含了物种的基因与基因组、酶促反应及其代谢途径和化合物等相关信息[18,19],是网络构建过程中网络数据信息的主要来源。而同源比对这一比较基因组学策略可以快速找到亲缘菌株之间的遗传关系及对应的生化信息,这一策略是构建全新微生物代谢网络模型的可靠信息来源。
1.1 基于KEGG在线数据库的模型构建
KEGG作为代谢网络构建常用数据库
您可能关注的文档
最近下载
- 01J925 1 压型板屋面.PDF VIP
- 视听语言 镜头运动.pptx VIP
- 广州市白云区广大附中实验中学2022-2023学年上学期期中调研八年级物理问卷.docx VIP
- JB∕T 5317-2016 环链电动葫芦.pdf VIP
- 广东省广州市白云区广大附中实验中学2022-2023学年八年级上学期期末线上考试语文试卷.doc VIP
- 风电机组专项隐患排查治理记录表.doc VIP
- 风电机组专项隐患排查治理记录表自查.pdf VIP
- 工厂生产管理制度(3篇).docx VIP
- 广东省广州市白云区广大附中实验中学2023-2024学年八年级上学期月考数学试题.docx VIP
- 2024年五恒系统行业洞察报告及未来五至十年预测分析报告.docx
文档评论(0)