- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 基因识别与基因组分析 全球基因组测序分布图 基因组测序 DNA一级结构回顾 Sanger双脱氧链终止法原理 1)在模板指导下,DNA聚合酶不断将dNTP加到引物的3’-OH末端,合成出新的互补链。如果加入双脱氧三磷酸核苷(ddNTP),由于双脱氧核糖的3’位置上缺少一个羟基,故不能同后续的dNTP形成磷酸二酯键,即形成一种全部具有相同5’-引物端和以双脱氧残基为3’端结尾的一系列长短不一片段的混合物。 2)双脱氧核苷酸在每个DNA分子中掺入的位置不同,采用聚丙烯酰胺凝胶电泳区分长度差一个核苷酸单链DNA,从而读取DNA核苷酸序列。 自动测序 基本原理 与链终止法测序原理相同,只是用不同的荧光色彩标记ddNTP,如ddATP标记红色荧光,ddCTP标记蓝色荧光,ddGTP标记黄色荧光,ddTTP标记绿色荧光。由于每种ddNTP带有各自特定的荧光颜色,而简化为由1个泳道同时判读4种碱基。 全基因组测序策略 基因识别 基因识别 基因结构回顾 原核基因 真核基因识别的主要方法 基于同源序列比较的方法 基于序列特征的方法 基于序列特征的方法 外显子与内含子接头——“GT–AG法则” 基于序列特征的方法 构建真核基因模型 构建真核基因模型 构建真核基因模型 构建真核基因模型 构建真核基因模型 构建真核基因模型 基因组注释 基因组注释流程 基因组注释流程 基因组注释流程 基因预测 基因组注释流程 基因功能分析 根据外显子的概率大小确定可能的基因结构 Exon 1 Exon 14 43 11 ATG AG ATG AG ATG AG GT GT TGA tccATGcagaccATGgcggtacaggacATGccggtgcagctctgactt tccATGcagaccatggcggtacaggacatgccggtgcagctctgactt ATGcagaccatggcgctctga 外显子1 内含子 外显子2 ORF Exon 1 Exon 14 43 11 (1)、FGENEH 所用算法:线性辨别分析(Linear Discriminant Analysis)方法 (2)、GeneID 所用算法:法则系统(Rule-based System)算法 (3)、GeneParser 所用算法:动态规划算法(Dynamic Programming) (4)、GRAIL 所用算法:人工神经网络方法 (5)、MZEF 所用算法:决策树(decision tree)方法 (6)、GENSCAN 所用算法:隐Markov模型(Hidden Markov Model)方法、动态规划算法(7)、Genie 所用算法:广义隐Markov模型(Generalized Hidden Markov Model)方法、动态规划算法 (8)、HMMgene 所用算法:隐Markov模型(Hidden Markov Model)方法 常用真核基因预测软件 敏感性(1)—被预测出的真实编码核酸(%); 敏感性(2)—被正确识别出的编码外显子(%); 特异性(1)—预测出的编码核酸为真实编码核酸(%); 特异性(2)—预测出外显子为真实外显子(%) 基因识别程序性能比较 Genscan(/GENSCAN.html) 分析举例(Genscan) 2) 选择适合物种模式物种作为参照 a)Vertebrate b)Arabidopsis c)Maize 3) 提供需要预测分析的序列(GenBank:AB363664),并选择相关合适的参数(默认参数) 4) 基因识别程序对提供的序列给出分析结果 分析举例(Genscan) 分析举例(Genscan) MZEF(/tools/genefinder/) 分析举例(MZEF) 2) 选择要预测的物种基因组序列 a)Human b)Mouse c)Arabidopsis d) Fission Yeast 3) 提供需要预测分析的序列(GenBank:AB363664),并选择相关合适的参数(Prior Probability:0.05) 4) 基因识别程序对提供的序列给出分析结果 分析举例(MZEF) MZEF、Genscan基因预测与已注释结果的比较 目前还没有一个基因预测工具可以完全正确地预测一个基因组中的所有基因(Mathe C, Sagot MF, Schiex T, Rouze P. 2002. Current methods of gene prediction, their s
文档评论(0)