第五章基因组序列注释详解.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第五章基因组序列注释详解演示文稿;优选第五章基因组序列注释;2weeks

~$1,000;Illumina/Solexa/GIIx

GeneticAnalyzer

50~95GB/run

Illumina/Solexa/HiSeq

200GB/run;高通量测序服务;高通量测序服务;高通量测序服务;高通量测序服务;学习重点:

1)基因注释的方法

2)基因功能的研究方法

;基因组序列所包含的全部遗传信息是什么?

基因组作为一个整体如何行使其功能?

用什么方法寻找基因?

用什么方法研究基因的功能?

计算机分析+实验

;真核生物基因组的注释

蛋白质编码基因的注释

RNA基因的注释

重复序列的注释

假基因的注释;基因组注释;第十三页,共88页。;3.1寻找基因;3.1.1根据基因结构特征搜寻基因;1.根据开放读码框预测基因

a.起始密码子ATG:

第一个ATG的确定则依据Kozak规则:

Kozak规则是基于已知数据的统计结果,

所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律。

;若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下:

(1)第4位的偏好碱基为G;

(2)ATG的5’端约15bp范围的侧翼序列内不含

碱基T;

(3)在-3,-6和-9位置,G是偏好碱基;

(4)除-3,-6和-9位,在整个侧翼序列区,C是

偏好碱基。

;b.终止密码子

终止密码子:TAA,TAG,TGA

GC%=50%终止密码子每64bp出现一次;

GC%50%终止密码子每100-200bp出现一次;

由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF不少于100个密码子。

;细菌基因组的ORF阅读相对比较简单,错误的概率较少,但单纯的ORF扫描对高等真核生物DNA效果不佳。;内含子的出现给计算机判读基因带来不少问题,对ORF扫描的基本程序的编写要考虑以下几个问题:

1)密码子偏倚;

2)外显子—内含子边界;

3)上游调控序列。;1)密码子偏爱性

编码同一氨基酸的不同密码子称为同义密码,

其差别仅在密码子的第3位碱基不同。

不同种属间使用同义密码的频率有很大差异,

如人类基因中,丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少使用。

特定种属有特征性的密码??偏爱,这些序列在

编码区常常出现,非编码区只保持平均的碱基

分布水平。;上游外显子-内含子边界的共有序列在真正基因中发现的真实序列之间的关系。;第二十三页,共88页。;3)上游控制顺序

几乎所有基因(或操纵子)上游都有调控序列,它们可与DNA结合蛋白作用,控制基因表达。

另外个别生物的基因组特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有CpG岛。

大多数CpG岛都位于管家基因和大部分组织专一性表达基因的5’侧翼区以及基因的第一个外显子区。

;3.1.2同源基因查询;同源有如下几种情况:

A.DNA序列某些片段完全相同;

B.开放读码框排列类似,如有等长外显子;

C.开放读码框翻译成的氨基酸序列的相同;

D.模拟多肽高级结构相似。;同源查询;同源性,一致性和相似性;2)一致性(identity):指同源DNA顺序的同一碱基位置的相同的碱基成员,或者蛋白质的同一氨基酸位置的相同的氨基酸成员,可用百分比表示.

3)相似性(similarity):指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。可取代氨基酸系指具有相同性质如极性氨基酸或非极性氨基酸的成员,它们之间的代换不影响蛋白质(或酶)的生物学功能。;相似性与一致性;基因注释软件;不同注释软件之间的效率;人类基因注释标准;人类基因总数可能是永远解不开的迷?;几种模式生物注释的基因总数;功能域注释;什么是功能域(domain)?;同源功能域注释;3.1.3实验确认基因

1.Northern杂交确定DNA片段是表达序列:;注意事项:

a.当某一基因的转录产物进行可变剪接时,由于连接的外显子不同,会产生好几条长度不一的杂交带,如果该基因是某一基因家族的成员也会出现多个信息;

b.考虑组织专一性和发育阶段的问题;

c.基因

文档评论(0)

办公文档大全 + 关注
实名认证
文档贡献者

文档来源于平时收集整理,如果不慎侵犯了您的权益,请私信联系本人删除,本人在看到消息后一定会在第一时间删除 。

1亿VIP精品文档

相关文档