生物序列联配中的算法全版.ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
S = “ a b c x d e x ”,T= “ x x x c d e ” 局部最优联配是: c x d e c - d e 或 x - d e x c d e .精品课件. * 空位处罚(1) 空位:序列中任意连续的尽可能长的空格。 空位的引入是为了补偿那些插入或缺失,但是在序列的联配中引入的空位不能太多,否则会使序列的排列变得面目全非。 每引入一个空位,联配的分值都会有所扣除,常见的罚分规则主要有两种: 空位权值恒定模型 仿射空位处罚模型 .精品课件. * 空位处罚(2) 空位权值恒定模型: 在每个空位中的空格的分值为零, 即:?(x,-)= ?(-,y) = 0 联配的分值为: 其中,Wg为开放一个空位的罚分 .精品课件. * 空位处罚(3) 仿射空位处罚模型(Affine Gap Model) 用一个附加的罚分比例去乘空位的长度 Wg+q×Ws 联配的分值为: .精品课件. * 空位处罚(4) 初始条件: V(0, 0) = 0; V(i, 0) = E(i, 0) = Wg + iWs; V(0, j) = F(0, j) = Wg + jWs; 递归条件: V(i, j) = max { G(i, j), E(i, j), F(i, j)}; G(i, j) = V(i-1, j-1) +σ(S[i], T[j]); E(i, j) = max {E(i, j-1) + Ws, V(i, j-1) + Wg + Ws} F(i, j) = max {F(i-1, j) + Ws, V(i-1, j) + Wg + Ws}. .精品课件. * 利用动态规划计算序列最优联配的算法的复杂度分析: 时间复杂度;O(nm) 空间复杂度:O(n+m) .精品课件. * 最新的相关的研究 在动态规划算法的基础上提出了一种新的方法,解决在序列局部联配的最优排列中经常出现的马赛克问题(在最优排列中间经常出现的相似度很低的保守区域) 把hash表方法引入到基因组序列的局部联配问题中,同时提高了原有算法的效率和质量 .精品课件. * 多序列联配(1) 两条序列联配问题的一般化推广 动机:携带更多的消息、生物学家的一种重要手段。 DNA或蛋白质数据库容量的指数级的增长,即使使用很简单的记分函数也很难找到一种在有效时间内的解决方法,而几乎所有的近似算法和许多的启发式算法,实际上都是在算法的计算速度和获得最佳联配结果的敏感性之间寻找一种权衡(tradeoff)策略。 .精品课件. * 多序列联配(2) rigorous算法 两条序列 多条序列, NP hard tree_based算法和 iterative算法 首先从序列中找出两条相似度最大的联配,然后按照相似度递减的顺序连续添加一些序列到最优的联配序列中。 序列非常接近或属于一个同源的家族 原始算法基础上的近似算法,但是它们也是非常耗时的。 .精品课件. * 多序列联配(3) 记分方法:用函数δ(x, y)来计算字符x和y之间的距离,两个序列的联配的距离分值我们用V来表示: k条序列联配的分值:为k条序列中任意两条序列(共有Ck2条)的分值(距离)V之和,用SP (Sum_of_Pairs)来表示: .精品课件. * 多序列联配(4) 中心星算法 输入:一组含有k条序列的集合? 找出序列St,St∈?,使得∑i≠tD( Si, St)的值最小,令A = { St } 逐次地添加Si∈?-{St}到A中,并使Si与St的联配的值最小;假设S1,S2,…Si-1已添加到A中,由于在分别和St进行联配的过程中需要加入一些空格,故此时A为:A = {S1’,S2’,…Si-1’,S’t}。添加Si到A中,按照两条序列联配的动态规划算法比较S’t和Si,分别产生新的序列St’’和Si’,再按照St’’中添加空格的位置调节序列S1’,S2’,…Si+1’为S1’’,S2’’,…Si-1’’,并用St’’替换St。 .精品课件. * 借助硬件来完成动态规划的算法 采用并行的固件,把问题有效地分配到多个处理器上运行,最后再把各处理器的运算结果收集起来 借助于一些比最初的动态规划算法更快的启发式算法。以降低运算结果的质量为代价来提高计算速度的。 .精品课件. * 启发式算法-FASTA 基本思想是:一个能够揭示出真实的序列关系的联配至少包含一个两个序列都拥有的字(

文档评论(0)

liuxiaoyu98 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档