- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
酵母转录因子结合位点保守性生物信息学分析
酵母转录因子结合位点保守性生物信息学分析
【摘要】目的:本研究拟发掘出酵母基因组中转录因子结合位点的保守性位点和规律。方法:本研究采用生物信息学中保守性模体参数Mi分析基因上游不同区域与真核生物转录因子结合位点保守性之间的关系。结果:转录因子Sok2、Swi4结合位点的保守性在基因转录起始位点上游各个区间的差异主要由其本身的序列特性决定。此外,本研究分别发掘出转录因子Sok2、Swi4结合位点的保守性位点。结论:本研究结果有助于提供新的参数用以改进现有预测转录因子结合位点的方法,在此基础上为深入研究真核生物的转录水平调控模式奠定理论基础。
【关键词】酵母; 转录因子; 结合位点;保守性;生物信息学
真核基因的表达调控可在多个层次上进行,但主要表现在对基因转录活性的调控上[1]。转录因子与对应DNA序列结合调控其目标靶基因的表达是基因表达调控的核心问题,因此转录水平的调控是真核基因表达最基本的调控方式[2]。转录因子不但可以结合在DNA序列上调控基因转录的起始,同时也可以招募组蛋白修饰酶,对转录因子结合位点附近的组蛋白进行修饰,而组蛋白修饰又可以促进DNA与转录因子的结合,还可能产生新的转录因子结合位点。正是由于不同发育阶段特异、细胞特异的反式作用因子与相应DNA调节元件的结合,导致了基因的差异表达[3]。
本研究以真核模式生物酵母的转录因子为研究材料,从酵母基因组的数据库SGD里提取转录因子结合位点的数据。研究结果将为为更加准确的预测真核生物转录因子结合位点提供数据支持,并且为更深入的解析真核生物转录调控网络奠定理论基础。
1材料与方法
1.1通过SGD数据库获得结合位点数据
酵母基因组数据库SGD 是已经完成基因组全序列测定的啤酒酵母基因组数据库, 包括啤酒酵母的分子生物学及遗传学等大量信息。从文献所报道的117个转录因子及其所调节的基因中,选取转录因子调控基因数目最多的两个转录因子Sok2、Swi4,研究其结合位点保守性。
1.2一致性序列选取
转录因子的一致性序列分别确定为:Sok2 TGCAGNNA(SGD);Gcn4 TGACTCA(TRANSFAC);对于转录因子Swi4有特殊处理,因为其常见结合一致性序列为CAAGAAAA和CGCSAAA(SGD),并且SGD数据里所给转录因子Swi4在TSS上游的结合位点为九位。
1.3转录因子结合位点保守性分析
1.3.1位置权重矩阵
1.3.1位置权重矩阵
本研究根据位置权重矩阵的思想,利用matlab 7.0 编写程序对所选取的每个转录因子所有结合位点实例片段进行不加入空位的比对,统计每个位点上四个碱基出现的频数。根据矩阵模型的原则,构建位置频率矩阵,再通过转换构建位置概率矩阵,最终构建位置权重矩阵。给定已知的N条转录因子结合位点,构建矩阵的目的就是要求所建的矩阵能够很好地区分出真正的转录因子结合位点序列和非转录因子结合位点序列,因此需要对构建的矩阵模型中的矩阵元进行权重。将位置概率矩阵PPM进行变换,构建位置权重矩阵(position-specific weight matrix) PWM:
1.3.2 转录因子结合位点的保守性统计
根据研究需要本研究改进了参量的数据,引入新的参量fib,以四种碱基在啤酒酵母基因中出现的实际频率作为P0b背景序列碱基出现的概率,对转录因子结合位点单个位点碱基保守性的参量进行修改,保守性的定义如下
M=■■方程(1-1)中fib是N条转录因子结合位点序列中碱基b在位置i中出现的实际频数,当某一位点碱基随机选取时,则每一种碱基b出现的频率应该为fib/N,碱基b的背景频率为P0b,fib/N-P0b是此位点某一碱基频率与随机选取这一碱基频率的差值。
2结果
2.1 转录因子在基因上游不同区域位置权重矩阵结果分析四个转录因子在TSS上游不同区间的位置权重矩阵用一致性序列打分的结果分析:S值(权重矩阵打分结果)并没有随距离的增加有明显规律变化。转录因子Cbf1与Swi4的S值都在TSS上游200~300 bp取最高值,而Gcn4在TSS上游100~200 bp取最高值。其中除Sok2,其它转录因子在TSS上游800 bp结合位点由于样本过小,均小于5,这些区域的S值可信度较低,所以省略不计。
2.2 Sok2 保守性分析结果通过对数据库SGD的搜索统计发现转录因子Sok2集中分布在基因上游200~1400 bp,(其它区域结合位点数都小于5,所以忽略不计)。统计Sok2结合的八个位点在基因上游不同区域保守性变化。
2.3 Swi4 保守性分析结果通过对数据库SGD的搜索统计发现转录因子Swi4 结合位点集中在TSS上
原创力文档


文档评论(0)