- 5
- 0
- 约8.88千字
- 约 73页
- 2017-09-06 发布于重庆
- 举报
生物序列的同源性 相似性和同源性关系 序列的相似性和序列的同源性有一定的关系,一般来说序列间的相似性越高的话,它们是同源序列的可能性就更高,所以经常可以通过序列的相似性来推测序列是否同源。 正因为存在这样的关系,很多时候对序列的相似性和同源性就没有做很明显的区分,造成经常等价混用两个名词。所以有出现A序列和B序列的同源性为80%一说。 序列相似性的概念 序列比对(aligment)是序列分析的基础,其他一切都建立在序列排比的基础上。 ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCAAGCTGCTAGCTAG ______________ __________________ 序列相似性的概念 序列排比是推导蛋白质二级结构的基础 是初步蛋白质功能推断的基础 可用于蛋白质三级结构的推导 可用于推导进化树和解释种间亲缘关系 用于分析分子水平的选择压力探测序列之间的相互作用 探测启动子单元等 MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG -------------PRNGTIKIYENPARTFTRPYSAKNITIYKEND 序列比较是如何进行的? 要分析两个序列是否相似,必须首先作比对分析(alignment)。 如何作排比分析? 最基本的条件是对序列的相似性做定量分析,然后将序列进行排比,在排比中要用到 gaps, insertions, substitutions。 对gaps和insertions打分可用较简单的扣分方案,而substitutions的打分则比较复杂,必须先构建出一个计算机的算法矩阵(Matrix),再根据此方案对序列中氨基酸残基之间的差异或相似进行打分。 序列比较是如何进行的? 要对两个序列进行排比,必须首先打出其相似性的定量分值,于是需要一个打分矩阵。 打分矩阵(Scoring Matrices): 给不同的氨基酸配对定义的一系列相似性分值。而一个突变打分方案(mutation data matrix)则是根据排比时序列中点突变的情况设计出的打分方案。对氨基酸配对相似性的尺度衡量,例如苯丙氨酸和异亮氨酸相似性的定量标准,可以以多种方式来定义。 序列比较是如何进行的? 打分矩阵(Scoring Matrices) 对氨基酸配对相似性的尺度衡量,例如苯丙氨酸和异亮氨酸相似性的定量标准,可以以多种方式来定义。因此,设计一个打分矩阵,首先必须确定用什么算法模型。在序列排比分析中,打分矩阵只是某个算法模型的量化表现,比对的结果只在该算法模型所划定的范围内有意义。 生物信息学发展的3个主要阶段 PAM系列矩阵 1. Margaret Dayhoff, 1978; 2. Accepted point mutation (PAM): 可接受的点突变,氨基酸的改变不显著影响蛋白质的功能; 3. 进化模型: 中性进化,Kimura,1968; 使用数据 1. 34个蛋白质超家族; 2. 72个蛋白质组; 3. 1572个突变; 4. 序列相似性 85% 统计氨基酸的替代 1. 对于同一个group内的蛋白质序列,统计氨基酸可能出现的频率,以及替换的个数; 2. 注意:不考虑空位; 对20种氨基酸做相同统计 PAM1矩阵的构建 1. 两个蛋白质序列的~1%氨基酸发生变化的时间; 2. 定义进化时间以氨基酸的变异比例为准,而不是时间;因为各个蛋白质家族进化的速度并不相等; 3. PAM2 = PAM1*PAM1 PAM3 = (PAM1)3 PAM250= (PAM1)250 PAM2矩阵 1. 基本假设:每个氨基酸的突变的概率独立于前次突变。因此,PAM2=PAM1*PAM1 PAM250矩阵 1. PAM250: 250%的期望的突变; 2. 蛋白质序列仍然有15-30%左右的相似性,例如: F-F: 32% A-A: 13% PAM矩阵的问题及改进 1. PAM系列矩阵存在的问题: A. 氨基酸的打分矩阵,不关心核酸; B. 进化模型的构建需要系统发育树的分析,因此,成为一个循环论证的问题:序列比对-矩阵构建-打分,进行新的序列比对; C. 数据集很小; 2. 打分矩阵的改进 BLOSUM系列矩阵 2. BLOSUM矩阵 1. BLOCK: 蛋白质家族保守的一段氨基酸,无gap,一般几个-上百个氨基酸; 2. Prosite家族:至少有一个BLOCK存在于该家族的所有蛋白质序列中; 3. 分析500个Prosite家族; 4. BLOSUM62: 序列的平均相似性为62%的BLOCK构建的打分矩
您可能关注的文档
- 高中历史全国教学评比课件3英国的制度创新.ppt
- 高中通用技术第二节稳固结构的探析课件苏教版必修2.ppt
- 贵州铜仁东太地产项目(东太金鳞半岛、思南东太鹭洲、江口梵净山国际度假中心)商业计划书.doc
- 海盐县发展现代海洋经济中的土地资源保障问题浅析.pdf
- 黑龙江案例--保险行业远程定损方案(客户部分).ppt
- 互联网对于政府而言是利还是弊?.ppt
- 华北地区天然气生产,运输,销售,利用各环节相互衔接的重要性.doc
- 机械设计基础课件凸轮机构H.ppt
- 基础网络信息资源的使用及检索技巧.ppt
- 基于BP神经网络的岩体质量评价_以甘肃北山旧井地段BS03号钻孔为例2007.pdf
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
最近下载
- 雷克萨斯-Lexus NX-产品使用说明书-NX200-ZGZ10L-AWXLPC2-NX200NX200t_OM78064C_01-1412-001.pdf VIP
- 小学语文五年级第二学期第二单元整体作业设计.docx
- 外研版小学英语(三年级起点)三年级上册Module2-Unit1同步检测.doc VIP
- 2025年河南省平顶山市中考生物试卷(含答案).pdf
- 【TD产业联盟】全球5G_6G产业发展报告(2024-2025).pdf VIP
- 乡镇卫生院年休假制度.docx VIP
- 职业技术教育教学管理新制度学分制.doc VIP
- 健康生活小常识100条.docx VIP
- 职业学校学分制实施细则.docx
- AP微观经济学 2010年真题 附答案和评分标准 AP Microeconomics 2010 Real Exam with Answers and Scoring Guidelines.pdf VIP
原创力文档

文档评论(0)