第三章DNA序列分析分析.ppt

  1. 1、本文档共192页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.1 概述 3.1.1 序列分析的意义 (1)DNA序列自身编码特征的分析是基因组信息学研究的基础,特别是随着大规模测序的日益增加,它的每一个环节都与信息分析紧密相关。 (2)基因组不仅是基因的简单排列,更重要的是它有其特有的组织结构和信息结构,这种结构是在长期的演化过程中产生的,也是基因发挥其功能所必须的。 (3)虽然对约占模式生物(包括人类)基因组 90%的非编码区的作用人们还不清楚,但从生物进化的观点看来,这部分序列必定具有重要的生物功能。普遍的认识是,它们与基因在四维时空的表达调控有关。寻找这些区域的编码特征,信息调节与表达规律是未来相当长时间内的热点,是取得重要成果的源泉。 (4)在不同物种、不同进化水平的生物的相关基因之间进行比较分析,是基因研究的重要手段。 目前,模式生物全基因组序列数据越来越多,因此,基因的比较研究,也必须从基因的比较,上升到对不同进化水平的生物在全基因组水平上的比较研究。这样的研究将更有效地揭示基因在生命系统中的地位和作用,解释整个生命系统的组成和作用方式。 3.1.2 序列分析的内容 (1)通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。 (2)通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。 (3)通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。 (4)通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。 3.1.3 DNA序列分析的目标任务 对于呈指数式增长的序列数据,通过序列分析,可以获得如下几个方面的信息: (1)序列及所代表的类群间的系统发育关系; (2)限制性酶切(位点)图谱; (3)籍内含子/外显子(intron/exon)预测所确定的遗传结构; (4)籍开放阅读框(ORF)分析所推导的蛋白质编码序列(coding sequence,CDS)。 基因与基因组分析技术路线 蛋白质与蛋白质组分析 蛋白质结构 新蛋白的完整、精确和动态的三维结构 计算机辅助结构模拟 理解蛋白质的氨基酸序列和三维结构之间的关系 蛋白质序列及特性分析 蛋白质组学 基因组分析 研究主要集中在核苷酸序列的存储、分类、检索和分析等方面 新基因的发现 非蛋白编码区生物学意义的分析 基因组整体功能及其调节网络的系统把握 基因组演化与物种演化 3.2 基因的结构 什么是基因? 基因是有遗传效应的DNA片断,是决定生 物性状的基本单位。 每个DNA分子上有很多个基因,每个基因 可以含有成百上千个脱氧核苷酸。 不同基因中脱氧核苷酸的排列顺序不同,因此不同的基因含有不同的遗传信息。 基因的功能: 基因能够储存、传递和表达遗传信息,也都可能发生突变,从而决定生物体的性状。 基因如何决定生物性状? 通过转录、翻译,控制合成具有一定氨基酸顺序的蛋白质,从而控制生物的性状。 编码区含有 能够编码蛋白质的序列(外显子,exon) 不能编码蛋白质的插入序列(内含子, intron) 真核生物的结构基因是断裂基因 不同基因所含的外显子和内含子数量不同 如人血红蛋白的?-珠蛋白基因有1700个碱基对,含有3个外显子和2个内含子,编码146个氨基酸。 一种凝血因子基因有186000碱基对,含有26个外显子和25个内含子,编码2552个氨基酸。 计算人的?-珠蛋白和凝血因子基因中外显子的碱基对在整个基因碱基对中所占的比例: (146×3)÷1700×100% = 26% (2552×3)÷186000×100% = 4% 从这个比例中你能得出什么结论? 在真核细胞中,不同基因的编码序列,在各自基因中所占的比例是不同的。 在真核细胞中,编码序列在整个基因中所占的比例是较少的,而非编码序列所占的比例则是较大的,从某种意义上体现了真核细胞基因结构与功能的复杂性。 3.3 核酸序列的概念性翻译 3.4 真核基因识别 3.4.2 基因识别的主要方法 3.4.3 编码区域识别 3.4.4 ORF Finder (Open Reading Frame finder ) ? Entrez 中提供的生物分子数据分析工具, 是一个图形化的分析工具 , 它能够在用户给定的核酸序列或者数据库中的核酸序列中寻找可能的开放阅读框 , 并推导出相应的氨基酸序列。 CpG岛(CpG island) ? CpG岛是指DNA上一个区域,此区域含有大量相联的胞嘧啶

文档评论(0)

w447750 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档