- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章_核酸序列分析.ppt
* * 第四章 核酸序列分析 4.1 DNA序列分析和基因结构 DNA序列分析的目的意义 在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。存放这些信息的DNA片段称为功能位点,如启动子(Promoter)、基因终止序列(Terminator sequence)、剪切位点(Splice site)等。 DNA序列分析就是在获得DNA原始序列的基础上,快速寻找基因,找出基因的位置及其功能位点,这对于基因的结构和功能研究,揭示生命奥秘具有重要意义。 UTR,非翻译区域(untranslated regions) 基因结构 原核生物基因结构 真核生物基因结构 基因不连续性:基因的编码序列在DNA分子上是被不编码的序列隔开而不连续排列,绝大多数真核生物基因是不连续的,由内含子(intron)和外显子(exon)组成。 发现重复元素 数据库搜索 分析功能位点 综合分析 基本的DNA序列分析方案 遮蔽重复序列 序列重复现象在原核、真核生物DNA中都存在,真核生物更普遍。有种属特异性,基因组越大重复序列含量越丰富。分为轻度重复序列、中度重复序列、高度重复序列等类型。 一般来说,在进行任何DNA序列的基因分析之前,最好把散布和简单的重复序列找出来并从序列中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶Ⅱ转录的部分区域,它们几乎不会覆盖启动子和外显子编码区。重复序列还常常会搅乱其它分析,特别是在数据库搜索中,由于重复序列的存在,可能得到许多同样的结果,这些结果的得分很高,使解释数据库搜索结果变得复杂、困难。 相关资源 CENSOR /censor/ RepeatMasker /cgi-bin/ WEBRepeatMasker Repbase /index.html 这些网站上的在线程序可帮助识别并去除重复序列。 同源性检索 一般来说,数据库相似性搜索是进行基因辨识的最初手段,也是DNA序列分析的最基本步骤。 在同源性检索中,通过查询DNA数据库来判断查询序列是否与已知基因的序列相同或相似。 例如,如果通过搜索发现待分析的序列与已知蛋白质编码序列相似,则可以推测待分析的序列是基因序列。 基因分析 序列翻译与开放阅读框(ORF)预测 序列翻译 指利用计算机程序将核酸序列按照三联体密码规则翻译成蛋白质序列,还可以将氨基酸序列倒翻成核酸序列。 阅读框(reading frames) 对于任何给定的单链核酸序列,根据密码子的起始位置,可以按照三种方式进行解释,这三种阅读顺序称为阅读框 。 双链DNA序列有6个可读框 开放阅读框(open reading frames,ORF) 以起始密码子(通常为ATG)开始,以终止密码子(TAA、TGA或TAG)结束(但不包括终止密码子),中间由一系列密码子组成的序列区域,它决定了所编码蛋白质的氨基酸顺序。 DNA序列分析中基因识别的目的之一就是进行开放阅读框(ORF)的寻找和预测。 ORF辨别的基本方法 (1) 利用编码区所具有的独特信号,比如起始密码子、终止密码子等进行识别 检查终止密码子的出现频率 基本思想: 如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,则这段序列可能就是编码区域。 基本算法: 扫描给定的DNA序列,在三个不同的阅读框中寻找较长的ORF。遇到终止密码子以后,回头寻找起始密码子。 这种算法过于简单,不适合于处理短的ORF或者交叠的ORF。 分析各种密码子出现的频率 基本思想: 每种氨基酸是由相应个数密码子编码的,例如,亮氨酸、丙氨酸、色氨酸分别有6个、4个和1个密码子。将一个随机均匀分布的DNA序列翻译成氨基酸序列,理论上说各氨基酸在序列中出现的比例应该符合氨基酸的密码子数目,如上述3种氨基酸出现的比例应该为6:4:1。但是在真实的氨基酸序列中,上述比例并不正确,这说明DNA的编码区域并非随机。 基本算法: 假设在一条DNA序列中已经找到所有的ORF,那么可以利用密码子频率进一步区分编码ORF和非编码ORF,利用这种方法,可以计算一个ORF成为编码区域的可能性。 (2)利用编码区与非编码区的碱基组成不同进行识别 由于蛋白质中20种氨基酸出现的概率不同,每种氨基酸的密码子兼并度不同,同一种氨基酸的兼并密码子使用频率不同等原因,造成单个碱基的组成比例和多个碱基的组成方式在不同的物种中呈现出不同的规律。 因此,可通
您可能关注的文档
最近下载
- 电力设备公司产品制造车间生产定额计件工资实施办法.docx VIP
- 2023国有企业“三重一大”决策制度实施细则办法.pdf VIP
- 安徽大学《地球科学概论》课件-第4讲大气圈、冰冻圈、岩石圈.pptx VIP
- 国家开放大学(电大)《农业生态基础.》2020年09月春季期末考试真题及答案(试卷代号2794).pdf VIP
- 餐饮行业员工职业规划.pptx VIP
- 《数学数学期望》课件.ppt VIP
- 肾病内科专业疾病临床诊疗规范2025版.docx VIP
- 质量信得过班组培训课件.pptx VIP
- 《高级英语FacetoFacewithHurricaneCamille》-精选课件(公开).ppt VIP
- 高中化学课件:芳环上的亲核取代反应.pptx VIP
文档评论(0)