3序列比对原理.pptx

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3序列比对原理

第三章 序列比对原理 Principles of Sequence AlignmentBiology - What is the biological question or problem?Data -What is the input data? -What other supportive data can be used ?Model -How is the problem formulated computationally? - Or, what’s the data model?Algorithm -What is the computational algorithm? - How about its performance/limitation?第一节 序列比对相关概念序列比对(sequence alignment)的定义:运用某种 特定的数学模型或算法,找出两个或多个序列之间的最大匹配碱基或氨基酸残基数,比对的结果反映了算法在多大程度上提供序列之间的相似性关系及它们的生物学特征。序列:核酸或蛋白质为什么要进行序列比对?基于同源物鉴定的功能预测囊肿性纤维化(Cystic Fibrosis,CF),亦称为囊性纤维化、囊肿性纤维变性或囊纤维变性,是一种常见的遗传疾病。此病症会影响病患的全身,导致逐渐的行动困难以及提早死亡。最常见的症状是因为长期反复的肺部感染所导致的呼吸困难,其他可能的症状包括鼻窦炎、发育不良、腹泻以及不孕。Cystic Fibrosis(囊性纤维化) and the adenosine triphosphate binding Protein基本假设:序列的保守性 功能的保守性注意:蛋白质一般在三级结构的层面上执行功能;蛋白质序列的保守性决定于其编码DNA的保守性。序列同源性模型中的进化假设1. 所有的生物都起源于同一个祖先;2. 序列不是随机产生,而是在进化上,不断发生着演变;3. 基本假设: 序列保守性 结构保守性注意:反之可以不为真。 结构保守性 序列保守性序列同源性模型中的进化假设1. 所有的生物都起源于同一个祖先;2. 序列不是随机产生,而是在进化上,不断发生着演变;3. 基本假设: 序列保守性 结构保守性注意:反之可以不为真。 结构保守性 序列保守性同源性(homology)- 具有共同的祖先(质的判断)相似性(similarity)同一性(identity)(三个重要概念见教材P47) —同源序列一般是相似的 — 相似序列不一定是同源的 — 进化趋同(同功能)“同源性”与“相似性”的用法使用ClustalW和DNAMAN 310分析了本实验室克隆的15个黄瓜抗病基因类似序列(RGA)之间以及与烟草的N 基因、亚麻的L6基因和拟南芥的RPS2基因之间的同源性, 并对这些RGA进行了PCR和Southern验证与分析。结果表明: 15个黄瓜RGA中, 核苷酸序列同源性最高的是CsRGA2、CsR2GA4和CsRGA5, 其次是CsRGA6、CsRGA7、CsRGA8和CsRGA9, CsRGA1和CsRGA3也存在较高的同源性; 其余的RGA同源性较低。在氨基酸序列上也表现了相同的特征。与N、L6和RPS2等抗病基因的产物之间同源性最高46% , 最低22%。(丁国华等,2007)相似性(相似度)直系同源与旁系同源序列的相似性描述定性的描述:画图定量的数值:相似度距离第二节 序列比对打分方法比对就是两条序列字符间简单的两两匹配。比对可以反映出两条或多条同源序列间的进化关系.最简单的情况下即不考虑空位,当两条序列对比时,要做的仅是为较短的序列选择比对的起始点。考虑这样的两条核苷酸序列: AATCTATA和AAGATA 仅有三种比对方式不考虑空位的简单比对,它的打分函数是有对比奖励和罚分的和来决定匹配得分:1失配得分:0上例中三个比对从左至右分别是 4、 1、 3空位两条或多条序列比对时,如果考虑到插入与删除时间发生地可能性,那么候选的比对数量就会大大增加,也就导致了比对的复杂性。上节中两条核苷酸序列,在不考虑空位时仅有三种比对,而较短的那条加入了两个空位后,变产生了28种不同的比对,例如:等等……简单空位罚分对含有空位的比对打分时,空位罚分就必须包含到打分函数中,空位比对的简单打分公式如下:例如:假设匹配得分为1,失配得分为0,空位罚分为-1三种空位比对的得分从左至右分别是1、3、3起始罚分与长度罚分使用简单空位罚分对两条序列进行比对时,经常能找到若干同格式最优的比对。进一步区分这些比对的方法是找出哪些比对包含较多的不连续空位,哪些包含较少长度较长的空位片段。插入/删除事件假设两条序列长度分别是12和9假设这两条序列是真正的同源序列,那么它们之间长度

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档