_核酸序列的一般分析.pptVIP

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
_核酸序列的一般分析.ppt

二、序列格式转化 各种软件为了自己的需要,通常对序列格式有一定的要求,给我们的使用带来了一定的困难。格式转换软件可以将不同格式数据转换以方便使用。很多综合性软件可以进行序列格式转换,如DNAstar,seqverter等。 常见序列格式: (1)FASTA格式(又称Pearson格式) 是比较简单而使用最多的序列格式。序列以号开头,其后是单行的关于序列的描述信息,最后是序列。例子: 10KD_VIGUN P18646 vigna unguiculata 10 kda protein precursor MEKKSIAGLCFLFLVLFVAQEVVVQSEAKTCENLVDTYRGPCFTTGSCDDHCKNKEHLLS 最新下载 /download.htm *下载后直接安装即可 三、DNA序列分析 ——基因序列 ——基因表达调控信息 寻找基因涉及到两个方面的工作 : 识别与基因相关的特殊序列信号 预测基因的编码区域 结合两个方面的结果确定基因的位置和结构 基因表达调控信息隐藏在基因的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。 1. DNA序列分析步骤 在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。 存放这些信息的DNA片段称为功能位点 如启动子(Promoter)、基因终止序列(Terminator sequence)、剪切位点(Splice site)等。 2. 核苷酸关联分析 对于一个给定的基因组,最简单的计算就是统计DNA序列中各类核苷酸出现的频率 对于随机分布的DNA序列,每种核苷酸的出现是均匀分布的 出现频率各为0.25。 而真实基因组的核苷酸分布则是非均匀的 在统计过程中,如果同时计算DNA的正反两条链,则根据碱基配对原则,A和T、C和G的出现频率相同。 如果仅统计一条链,则虽然A和T、C和G的出现频率不同,但是非常接近。 两联核苷酸频率: 不同基因组中两个连续核苷酸出现的频率也是不相同的 4种核苷酸可以组合成16种两联核苷酸 三联核苷酸——基因密码子: 在进行编码区域识别时,常常需要对三联核苷酸进行统计分析,这实际上是分析密码子的使用偏性。 由于密码子的简并性(degeneracy),每个氨基酸至少对应1种密码子,最多有6种对应的密码子。 在基因中,同义密码子的使用并不是完全一致的。 不同物种、不同生物体的基因密码子使用存在着很大的差异 基因密码子的使用与基因编码的蛋白的结构和功能有关,与基因表达的生理功能有着密切的联系 蛋白的三级结构与密码子使用概率有密切的关系 通过对密码子的聚类分析,可以很清晰地将具有不同三级结构蛋白质的编码基因分成不同的类,而具有相似三级结构蛋白的编码基因则大致聚在同一类中,从而证明基因密码子的使用偏性与蛋白质三级结构具有密切的相关性。 在不同物种中,类型相同的基因具有相近的同义密码子使用偏性 对于同一类型的基因由物种引起的同义密码子使用偏性的差异较小 3. 功能位点分析 功能位点(functional site) 与特定功能相关的位点,是生物分子序列上的一个功能单元,或者是生物分子序列上一个较短的片段。 功能位点又称为功能序列(functional sequence)、序列模式(motif)、信号(signal)等。 核酸序列中的功能位点包括转录因子结合位点、转录剪切位点、翻译起始位点等。 在蛋白质序列分析中,常使用序列模式这个名词,蛋白质的序列模式往往与蛋白质结构域或者作用部位有关。 基因组序列中若干个相邻的功能位点组合形成功能区域(functional region)。 功能位点分析的任务 发现功能位点特征 识别功能位点 四、序列翻译、ORF查找 对于一条新的核酸序列,除了对数据库进行类似性检索和同源性比较外,还有许多其他分析内容。例如:计算DNA的碱基组成、检索内部重复序列、检索DNA的特殊位点或信号、开放读框的查找、鉴定DNA的编码区和翻译基因序列等。 基因编码区是指可以由核糖体翻译成蛋白质的序列,它的5’端有转录和翻译的起始位点,3’端有终止位点。基因的起始位点通常是ATG,终止位点为TAA、TAG、TGA。 一个起始和终止密码子之间的序列称为一个开放阅读框(Open Reading Frame,简称ORF),它是一个潜在的蛋白质编码区。 序列翻译、ORF查找 1. Generunner 2. 在线的ORF finder /gorf/gorf.h

文档评论(0)

docinppt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档