双序列比对-哈医大《生物信息学基础》课件.pptVIP

双序列比对-哈医大《生物信息学基础》课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
双序列比对-哈医大《生物信息学基础》课件.ppt

2009-7-12 第二章 双序列比对 哈尔滨医科大学 生物信息学院 李霞教授 第一节 引言 同源(homology)- 具有共同的祖先 直向同源(Orthologous ) 共生同源(paralogous ) 相似(similarity) 同源序列一般是相似的,相似序列不一定是同源的 通过点矩阵进行序列比较 编辑距离(Edit Distance) 相似性得分 第二节 打分矩阵 (1)核酸打分矩阵设DNA序列所用的字母表为 ? = { A,C,G,T } a. 等价矩阵 (unitary matrix) b. BLAST矩阵 c. 转移矩阵(transition,transversion) (嘌呤:腺嘌呤A,鸟嘌呤G;嘧啶:胞嘧啶C,胸腺嘧啶T) (2)蛋白质打分矩阵 (i)等价矩阵 (ii) 氨基酸突变代价矩阵GCM (iii)疏水矩阵 (iv)PAM矩阵(Point Accepted Mutation) (Dayhoff模型:可接受点突变) (v) BLOSUM矩阵 (Blocks Amino Acid Substitution Matrices) 氨基酸突变代价矩阵GCM 一个氨基酸残基转变到另一个氨基酸残基所需的密码子碱基变化数目 1 或 2 只有Met到Tyr为 3 疏水矩阵 PAM BLOSOM 这类矩阵里列出同源蛋白质在进化过程中氨基酸变化的可能性。 这类矩阵式基于进化原理的 证据: 编码相同蛋白质的基因随着进化发生分歧,相似度降低。 科学 用得多 Constructing PAM Matrix: Training Data PAM: Phylogenetic Tree PAM: Accepted Point Mutation Mutability of Residue j Normalize Total Mutation Rate to 1% PAM60—60%, PAM80—50%, PAM120—40% PAM-250 matrix provides a better scoring alignment than lower-numbered PAM matrices for proteins of 14-27% similarity PAM Matrix: Assumptions PAM = % Accepted Mutations: 1500 changes in 71 groups 85% similarity BLOSUM = Blocks Substitution Matrix: 2000 “blocks” from 500 families PAM矩阵与BLOSUM矩阵的比较 第三节 双序列比对算法 序列的两两比对 (Pairwise Sequence Alignment) 按字符位置重组两个序列,使得两个序列接近一样的长度 子序列与完整序列的比对 ----AGCT---- ATGCAGCTGCTT 目标: 使S(s, i:t:j ) 最大 三、比对的统计学显著性 (1)典型方法: 将两条待比较的序列分别随机打乱 使用相同的程序与打分函数(或打分矩阵)进行比对 计算这些随机序列的相似性得分 重复这一过程(50~100次)用?和?分别表示其平均值与标准差。 设原来两条序列的比对得分为x,利用下式计算大于或等于x的比对得分概率: z = (x - ?)/? 根据z值判断两个序列相似得分的显著性 ,当z值是3.1、4.3、5.2时,x出现的概率为10-3、10-5、10-7 Z 5,同源; Z 3, 不同源; Z = 3~5, 可能同源 经验法则(针对蛋白质序列): ① 如果两个序列的长度都大于100,在适当地加入空位之后,它们配对的相同率达到25%以上,则两个序列相关; ② 如果配对的相同率小于15%,则不管两个序列的长度如何,它们都不可能相关; ③ 如果两个序列的相同率在15%?25%之间,它们可能是相关的。 一、 BLAST 简介 BLAST 应用实例 多结构域蛋白 (H1N1) 脂质运载蛋白 多结构域蛋白 (H1N1) 的BLAST检索 多结构域蛋白 (H1N1) 的BLAST检索 BLAST结果综述 BLAST结果表述 BLAST结果逐条显示 BLAST结果逐条显示 BLAST:改变打分矩阵的作用 脂质运载蛋白 使用Blosum62矩阵搜索 使用PAM30矩阵搜索 谢谢使用 刘建国 闫蓬勃 Liu@ BLAST软件包实际上是综合在一起的一组程序,不仅

文档评论(0)

coo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档