- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 序列比对与分子系统发育分析 序列比对与分子系统发育分析 为什么要序列比对? 基于同源物鉴定的功能预测 基本假设: 序列的保守性 功能的保守性 注意: 1. 蛋白质一般在三级结构的层面上执行功能; 2. 蛋白质序列的保守性决定于其编码DNA的保守性; 序列联配(比对) 序列比对又称为序列联配,是指用某种特定的数学模型与算法,找出两个或多个序列之间的最大匹配碱基与残基,尽可能客观的反映它们之间的相似与相异,从而进一步判断它们之间是否同源。 用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找motif,保守区域等。 用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。 其他应用,如构建profile,打分矩阵等。 手工比对 辅助编辑软件如bioedit,seaview,Genedoc等 通过辅助软件的不同颜色显示不同残基,靠分析者的观察来改变比对的状态。 计算机程序自动比对 通过特定的算法(如同步法,渐进法等),由计算机程序自动搜索最佳的多序列比对状态。 CLUSTAL是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。 输入序列的格式比较灵活,可以是前面介绍过的FASTA格式,还可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。 输出格式也可以选择,有ALN、GCG、PHYLIP和NEXUS等,用户可以根据自己的需要选择合适的输出格式 2.两种工作模式。 a.多序列比对模式。 b.剖面(profile)比对模式。 3.一个实际的例子。 Clustalx的工作界面(剖面(profile)比对模式) 多序列比对实例 输入文件的格式(fasta): KCC2_YEAST NYIFGRTLGAGSFGVVRQARKLSTN…… DMK_HUMAN DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK……. KPRO_MAIZE TRKFKVELGRGESGTVYKGVLEDDRHVAVKKLEN…… DAF1_CAEEL QIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD…… 1CSN HYKVGRRIGEGSFGVIFEGTNLLNN…… 第一步:输入序列文件。 第二步:设定比对的一些参数。 ClustalX生成.dnd和.aln两个文件,可用文本编辑器打开来看,这时.aln文件,这个文件可以用Mega做进一步的bootstrap进化树分析 Clustalx生成的树 用treeview(专门看树的软件)就可以打开这个dnd文件. 基本概念: 系统发生(phylogeny)——是指生物形成或进化的历史; 系统发生学(phylogenetics)——研究物种之间的进化关系; 系统发生树(phylogenetic tree)——表示形式,描述物种之间进化关系; 现代系统发生学采用DNA或者蛋白质作为分类特征,有许多优点: 许多分子特征可以同时标记,例如某些遗传标记、分子标记等 分子特征的状态清晰; 分子资料便于转化为数字形式,可进行修正和统计分析; 表型分枝图(phenogram) 进化分枝图(cladogram) 有根树 无根树 表型分枝图(phenogram) 如果是一棵有根树,则树根代表在进化历史上是最早的、并且与其它所有分类单元都有联系的分类单元; 如果找不到可以作为树根的单元,则系统发生树是无根树; 从根节点出发到任何一个节点的路径指明进化时间或者进化距离。 进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。 对于给定的分类单元数,有很多棵可能的系统发生树,但是只有一棵树是正确的。 系统发生分析的目标 ——寻找这棵正确的树 (1)选择可供分析的序列; (2)同源蛋白质或者核苷酸序列的多重序列比对; (3)构建系统发生树; (4)评价所建立的树; 离散特征数据: 它提供了基因、个体、群体或物种的信息; 相似性和距离数据: 它涉及的则是成对基因、个体、群体或物种的信息 进化树的评估 选择计算参数 Distance Options标签页中的Models可以下拉,其中有若干个计算距离的方法可以选择,在此默认泊松校验(Poisson Correction)作为计算距离的方
您可能关注的文档
最近下载
- IQC岗位技能培训.pptx VIP
- 沪教版七年级上册unit6Grammar-《Conditionalsentences(1)》_沪教版.docx VIP
- 福雷声乐套曲《一日诗》的艺术特征与歌唱分析.pdf VIP
- 安徽省义务教育阶段学校实验室、现代教育装备、图书及教学软件配置标准.doc VIP
- Unit 6 Numbers in life Part A Let's learn课件人教版英语三年级下册.ppt
- 卫星运行可视化仿真系统与研究.pdf VIP
- 第四届山东省人工智能融合创新职业技能竞赛服务机器人应用技术员赛项规程.pdf VIP
- 激光原理PPT全套教学课件.pptx
- 浅析山西省经济发展产业转型与金融支持.doc VIP
- 磨削过程的运动学仿真.docx
文档评论(0)