- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 核酸序列分析和预测 山西农业大学动物科技学院 核酸序列分析是用理论方法预测核酸序列的结构和功能,是解析基因组信息和发现新基因的基础。 核酸序列的分析和预测是基于不同的数学模型和算法,有其各自的适用范围,且结构正确与否还需要生物实验验证。 核酸序列分析的意义 遗传信息大部分以基因的形式储存在DNA分子中,如果核苷酸的排列顺序发生改变,那么它的生物学含义也将发生改变。 建立快速、准确的核苷酸序列分析方法,对研究基因的结构和功能、揭示生命奥秘有十分重要的意义。 Background Knowledge 真核生物基因结构 序列格式 序列格式 各种软件通常对序列格式有一定的要求。 格式转换软件可以将不同格式的数据相互转换,如DNAstar,seqverter等。 常见序列格式 (1)FASTA格式 又称Pearson格式。是比较简单而使用最多的序列格式。序列以号开头,其后是单行的关于序列的描述信息,最后是序列。 10KD_VIGUN P18646 vigna unguiculata 10 kda protein precursor MEKKSIAGLCFLFLVLFVAQEVVVQSEAKTCENLVDTYRGPCFTTGSCDDHCKNKEHLLS 常见序列格式 (2) plain text格式 形式最简单的格式,没有任何的注释,每行60个字母,使用标准核甘酸符号或标准的氨基酸的单字母符号。 MEKKSIAGLCFLFLVLFVAQEVVVQSEAKTCENLVDTYRGPCFTTGSCDDHCKNKEHLLS CENLVDTYRGPCFTTGSCDVLHLKELFVAQEVMEKKSILVAGSLCFLFVQCKNSEAKTDH KSIAGLCFLRGQKTEVPLSKFEVDHMAALYCKCQEVTGLFLESVDDCNLFTTCNKEHVVS 真核生物基因结构的分析和预测 序列的基本分析 ? 序列比对和同源性分析 ? 开放阅读框分析 ? 内含子/外显子结构预测 ? 限制性内切酶分析 ? 重复序列分析 ? (1)分子质量、碱基组成、碱基分布 可通过一些常用软件等直接获得。如BioEdit和DNAMAN。 (2)序列变换 如反向序列、互补序列、反向互补序列、显示DNA双链、转换为RNA序列等。这些用DNAMAN软件可很容易实现,这些功能集中在Sequence→Display,从中可选择不同的序列变换方式对当前通道的序列进行转换。 (3)查看测序峰图和去除载体序列 查看测序峰图的常用工具: Chromas,BioEdit和DNAMAN。 核酸序列的比对和同源性分析 1、基于NCBI/Blast的核酸序列比对和同源性分析 2、核酸序列的两两比较和多序列比对?常用工具: DNAMAN? ClustalX DNAMAN 常用的核酸序列分析软件。由于它功能强大,使用方便,已成为一种普遍使用的DNA序列分析工具。 ClustalX 核酸和蛋白质的多序列比对(multiple sequence alignment)。 发现特征保守序列,显示序列间的同源性,预测新序列的二级和三级结构,为蛋白质分类和分子进化分析提供依据。 欧洲生物信息研究所(EBI)开发。 ClustalX 原 理 “渐进式比对(progressive alignment)”算法 若有N条序列,首先对这N条序列进行两两比对,计算序列间距离,从而得到N*N的距离矩阵;根据距离矩阵构建系统发育树来指导多序列比对。 ClustalX ClustalX 使用方法 分析碱基组成,变换序列,进行相似性比对和同源性分析等是了解核酸序列的最基本手段。 检索内部重复序列、检索DNA的特殊位点或信号、开放读框的查找、鉴定DNA的编码区和翻译基因序列等可以帮助我们深入解读序列中蕴藏的生物学秘密。 开放阅读框分析 编码区(Coding Sequence,CDS) mRNA分子中能翻译成多肽的那部分序列。来自DNA分子中的外显子,或者是DNA或mRNA中对应于蛋白质中氨基酸序列的一段核苷酸序列。 5’端有转录和翻译的起始位点,3’端有终止位点。基因的起始位点通常是ATG,终止位点为TAA、TAG、TGA。 开放阅读框分析 读码框架(Reading frame) 序列:ACGACGACGACGACGACG 可能的读码框架就有以下三种: ACG ACG ACG ACG ACG ACG ACG ACG CGA CGA CGA CGA CGA CGA CGA CGA GAC GAC GAC GAC GAC GAC GAC GAC 正反向两条链就有6种读码框架。 开放阅读框分析 开放阅读框
您可能关注的文档
- (广州国际疾病与手术操作分类培训资料)ICD-10第三章:血液及造血器官疾病和某些涉及免疫机制的疾患-2013.ppt
- (广州国际疾病与手术操作分类培训资料)ICD-10第十九-二十二章练习题.ppt
- (广州国际疾病与手术操作分类培训资料)ICD-10第十九章-损伤、中毒和外因的某些其他后果.ppt
- (广州国际疾病与手术操作分类培训资料)ICD-10第十六章起源于围生期的某些情况.ppt
- (广州国际疾病与手术操作分类培训资料)ICD-10第十五章-妊娠、分娩和产褥期.ppt
- (广州国际疾病与手术操作分类培训资料)ICD-10第十章、第十一章、第十二章-呼吸系统疾病.ppt
- (广州国际疾病与手术操作分类培训资料)ICD-10第四章:内分泌、营养和代谢疾病-2013.ppt
- (广州国际疾病与手术操作分类培训资料)ICD-10第五章、第六章精神和行为障碍.ppt
- (广州国际疾病与手术操作分类培训资料)单病种与临床路径.pptx
- (广州国际疾病与手术操作分类培训资料)第8--11章呼吸系统手术.ppt
文档评论(0)