真核生物启动子预测相关数据库资源概述修改稿.docVIP

真核生物启动子预测相关数据库资源概述修改稿.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
真核生物启动子预测相关数据库资源概述 刘玉瑛 张江丽2 1(首都师范大学生命科学学院,北京 100037) 2(廊坊师范学院生命科学学院,河北 廊坊 065000) 摘要:启动子是基因表达调控的重要元件,深入研究启动子的结构和功能,是理解基因转录调控机制和表达模式的关键。随着生物技术和计算机技术的高速发展,应用生物信息学技术对启动子进行预测和分析的方法得到了很大发展。本文对目前常用的真核生物启动子预测相关数据库和软件资源做一简单介绍。 关键词:真核生物 启动子 数据库 预测 作为基因表达所必需的重要序列信号和基因转录水平上一种重要的调控元件,真核生物的启动子一直是现代分子生物学的研究热点。用实验的方法分析和鉴定启动子是多年以来进行启动子研究的主要途径。但近年来,随着人类基因组测序的完成和根据实验获得的对启动子的序列特征与结构功能的认识,利用生物信息学的方法,通过计算机模拟和计算来预测基因启动子的相关信息获得越来越多的应用。本文对目前常用的几个启动子预测数据库和相关软件资源做一简单介绍。 1.真核生物启动子的基本结构 真核生物的启动子有三种类型,分别由RNA聚合酶Ⅰ、Ⅱ和Ⅲ进行转录。典型的真核生物启动子由核心启动子、上游元件和应答元件构成。 核心启动子包括起始子和基本启动子。其中起始子是DNA解链并起始转录的位点。基本启动子序列为中心在-25至-30左右的7bp保守区,其碱基频率为:T85A97T93A85A63A83A50,通常被称为TATA框或Goldberg-Hogness框,具有选择正确的起始位点,保证精确起始的功能。同时,TATA框还能影响转录速率。如兔的珠蛋白基因中TATA框的保守序列ATAAAA人工突变为ATGTAA时,转录效率会下降80%。 上游元件主要包括CAAT框和GC框两种,均具有增强转录活性的功能。其中,CAAT框的保守序列是GGCTCAATCT,一般位于上游-75左右紧靠-80,与其相互作用的因子有CTF家族的成员CP1、CP2和核因子NF-1等;GC框的保守序列是GTGGGCGGGGCAAT,常以多拷贝形式存在-90处,识别该序列的转录激活因子为Sp1。两种上游元件或者同时存在,或者只存在其中之一,但并非所有真核基因的启动子都存在上游启动子元件,例如有些植物细胞中几乎不存在CAAT框。 应答元件通常位于基因上游,能被转录因子识别和结合, 从而调控基因的专一性表达。 如热激应答元件、激素应答元件, cAMP 应答元件, 金属应答元件、糖皮质激素应答元件和血清应答元件等。应答元件含有短重复序列, 不同基因中应答元件的拷贝数相近。 2.真核生物启动子预测相关数据库资源 EPD(Eukaryotic Promoter Database)[1] EPD数据库(http://www.epd.isb-sib.ch/ 或者ftp://ftp.epd.isb-sib.ch/pub/databases/epd )是一个针对真核RNA聚合酶II型启动子的非冗余数据库。现有启动子序列数据1500多个,按层次组织。关于启动子的描述信息直接摘自科学文献。该数据库中所有的启动子均经过一系列实验证实,如:是否为真核RNA聚合酶Ⅱ型启动子、是否在高等真核生物中有生物学活性、是否与数据库中的其他启动子有同源性等等。同时,EPD与其他的相关数据库如EMBL、SWISS-PROT、TRANSFAC等,实现了数据的交叉链接。在其最新版本(第76版)中,EPD将收集的启动子分为六大类:植物启动子、线虫启动子、拟南芥启动子、软体动物启动子、棘皮类动物启动子和脊椎动物启动子,共2997个条目,其中人类启动子有1871个,约占总数的62%。EPD数据库是目前唯一一个源自实验数据的真核生物启动子数据库,是常用的预测软件测评的手段之一。 2.1 PLACE(Plant cis-acting regulatory DNA elements)[2] PLACE数据库 (http://www.dna.affrc.go.jp/htdocs/PLACE/,FTP服务器为ftp://ftp.dna.affrc.go.jp/)是从已发表文献中搜集植物顺式作用元件资料而建立的模体数据库(motif database),始于1991年。目前服务器位于日本农林渔业部。PLACE数据库中只囊括维管植物的信息,其它与植物顺式作用元件同源的非植物模体也同时被收录。并且所收录信息根据实验最新进展随时得到更新。同时,PLACE数据库中还包括了对每个模体的描述和在PubMed中的相关文献编号,以及在DDBJ/EMBL/GenBank的核酸序列数据库的登录号,点击后可阅读相关文献摘要等信息。登陆PLACE数据库界面,用户可通过关键词、SRS关键词或者同源序列查询顺式作用

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档