- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
序列比对的一些算法思想
序列比对的一些算法思想;一、序列比对的意义;二、序列比对的一般过程;(一)序列比对的得分系统;b.转换颠换矩阵(transition,transversion)
(嘌呤:腺嘌呤A,鸟嘌呤G;嘧啶:胞嘧啶C,胸腺嘧啶T)
b c
c.BLAST矩阵
;2,蛋白质打分矩阵
PAM矩阵(Point Accepted Mutation)
﹡ 基于进化位点突变模型,通过统计相似序列比对中的各种氨基酸替换发生率而得到该矩阵。
﹡ PAM 概率矩阵?对数比值矩阵
( Mab:a,b真实比对概率 Pb:随机情况下b比对的概率)
﹡序列相似度 = 40% 50% 60%
| | |
打分矩阵 = PAM120 PAM80 PAM 60
PAM250 → 14% - 27%
;b. BLOSUM矩阵(Blocks Amino Acid Substitution Matrices)
﹡依据保守域模块建立,对氨基酸相似性不低于62%的蛋白质序列比对进行统计构建BLOSUM62
BLOSUM概率矩阵?对数比值矩阵
﹡
;BLOSUM62;3,空位罚分体系
a.线性罚分
b.仿射罚分(affine penalty) ;(二)序列比对算法;1,点阵法
;2,动态规划算法
a. N-W算法是一种全局比对动态规划算法。
首先假设我们要对两条序列a和b进行比对,它们的长度分别为M和N,序列a的第i个字符(残基)为 ,序列b的第j个字符为 。动态规划算法由四部分组成:1)最优化的递归计算方法; 2)存储子问题的最优化的动态规划矩阵;3)给出自问题最优解的矩阵填充过程和4)寻找最优化比对路径的回溯方法。
;b. S-W局部比对算法
局部比对的应用范围比全局比对更广。
S-W算法与N-W算法的区别在于多了一个去头去尾的操作。
去头,在动态规划矩阵的每个单元格的计算增加一条路径。也就是如果当前比对分数小于0,那么之前的比对全部去掉,比对从目前位置重新开始。
去尾,回溯的时候不是从最后开始,而是从最大的分数开始。
;Algorithm: Similarity
input: s and t; output: similarity between s and t
;Algorithm Align
input: indices i, j , array a given by algorithm Similarity
output: alignment in align-s, align-t, and length in len
if i =0 and; j=0 then
len=0
else if i 0 and a[i, j] = a[i-1, j] + g then
Align(i - 1, j , len)
len =len + 1
align-s[len] = s[i]
align-t[len] =“-”
else if i 0 and j 0 and a[i, j] = a[i-1, j-1] + p(i, j) then
Align(i -1, j -1, len)
len=len + 1
align-s[len]=s[i]
align-t[len]= t[j]
else // has to be j 0 and a[i, j] = a[i, j-1] + g
Align(i, j-1, len)
len = len + 1
align-s[len]=“-”
align-t[len]=t[j]
;例1:利用S-W算法对两条DNA序列进行全局比对。a=ATTCCAAG,b=TTCGAGT,得分系统:{4,-3,-4}(匹配得4分,不匹配得-3分,空隙得-4分)
1)给动态规划矩阵赋初值。
;2)按照最优化的递归算法填充动态规划矩阵。
;3)从最后一个单元格开始,回溯最优化比对路径
;例2:利用S-W算法对两条DNA序列进行局部比对。a=ATTCCAAG,b=TTCGAGT,得分系统:{4,-3,-4}(匹配得4分,不匹配得-3分,空隙得-4分)
1)给动态规划矩阵赋初值。
;2)按照最优化的递归算法填充动态规划矩阵。
;3)从矩阵中分值最大的单元格开始,回溯到0为止得到最优比对路径。
;(三)序列比对
您可能关注的文档
- 年1月建龙各钢铁子公司生产经营指标对比情况.ppt
- 年三年发展规划汇报材料.ppt
- 年下年度保千里员工晋升答辩会圆满完成.ppt
- 平衡针灸穴位详图及秘窍.ppt
- 年中考复习 安全用电.ppt
- 年上海赛洋北京地区媒体高科-商场.ppt
- 年产20万吨丙烯酸生产流程概念设计.ppt
- 年中行事6.ppt
- 年代理人考试培训复审无效程序.ppt
- 年全区地理学科中考说明解读.ppt
- 现代汉语课件 2 第五章第二节词类(上)(划分词类的依据)学习资料.ppt
- 2024-2025学年高二上学期英语期末模拟卷一(新高考地区)含答案解析.pdf
- 专题17 5重点和7句话+61句能为作文增色的精彩诗文-2023年中考语文热点作文素材解读及运用.docx
- 专题16 九上Units 7-8(知识梳理+常考易错点归纳+强化提升练)(原卷版)- 备战2024年中考英语一轮复习考点帮(江苏专用).docx
- 综合训练06诗歌鉴赏+记叙文阅读+名著阅读(原卷版+解析).docx
- 专题16 文体活动-【妙笔生花】2024年中考英语写作常考文体提分秘籍(原卷版).docx
- 衔接点08九年级上册Unit2Topic1预习(原卷版+解析)-2021年【衔接教材·暑假作业】九年级英语(仁爱版).docx
- 专题27 热点素材:《灌篮高手》+国泰空乘歧视非英语乘客、AI换脸诈骗、公器私用、路怒双输-2023年中考语文热点作文素材解读及运用.docx
- 专题29 小说常考题+病句的10个“不放过”-2023年中考语文热点作文素材解读及运用.docx
- 专题28 思辨类话题名言金句+5篇关于经典人物的精彩时评+热点时评-2023年中考语文热点作文素材解读及运用.docx
文档评论(0)