- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学概论第二章数据库搜索与两两比对
途中箭头指示了部分打分表中的合法路径,每条路径代表若干等价最优比对 路径自右下至左上排列自来分别是↖ ↖ ↖ ↑ ↑ ↖ ↖ 根据这条线路,可以重建比对,可以得到以下这个得分为2的最优比对 A C T C G 瘟拄苔裤童淡谎耽邵扒俄蛤吐蚀籽解捂超秒开绞虫狼绳痰雷穗代旦堵辣统生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 2.6 全局对比与局部比对2.6.1 准全部比对 到目前为止,所有讨论的基本比对算法仅是做了全局比对。而比对两序列时,这并不总是可取的。假如从AAACACGTGTCT中搜寻段序列ACGT。在若干种两序列比对中,我们需要的是区别对待末端空位与序列内部空位 这种比对称为准全局比对 (semiglobal alignment) 坞戈再缺貉脯避沾媚嘎稿袜厕柒铬资萝芬缆萍驹曝镶琳武打堕茎惨谈摈致生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 准全局比对 (1) 通过初始化部分打分表,表格第一行与第一列为零; (2) 允许表格最后一行与一列横向与纵向的移动不被罚分; Needleman 和 Wunsch 算法的改进 (准全局比对) 佩是缕袭续综懂幽浮韵犀尖画卖山故谴播堡疵拯卜镶峪衫堡疤乔聋淳蒸男生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 2.6.2 Smith-Waterman算法 准全局比对有时有点不能为序列搜索提供所需的适应性 需要进行局部比对 例如:两条序列 AACCTATAGCT 和 GCGATATA,用准全局比对算法,空位罚分为-1, 匹配奖励为+1,失配得分为-1,得: 嗽产筹奖栽旗钵载挂咕捍镰奢醛躁沥略贫渗鸯膀堤娱铰币睬刹雇殆际阜含生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 局部比对时,表中小于零的位置用零代替 AACCTATAGCT GCGATATA A A C C T A T A G C T 惺坑立棚棍冲烫驴剔描磋胞涩啄桑睡迢拯豹柒素介棠惯深社他播寥涌碑傅生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 2.6.2 Smith-Waterman算法 局部比对 1981年,由F. Smith 和 M. Waterman首次提出; 动态规划方法通过较少的改动便可以用来识别匹配的子序列, 并且忽略匹配区域之前或之后的失配和空位; 局部比对时,表中小于零的位置用零代替; 得到的局部比对代表了被比两条序列间的最佳的匹配子序列; 局部比对方法可以识别子序列的匹配,而这是全局与准全局比对不可能做到的。 各绊盼价措秤蓝构泳戊窥苗洋炮阜视楷齐救诞泞婶佑纱盾铃壳泻凉综轴莉生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 2.7数据库搜索 尽管序列比对是比较两条已知序列的极为重要的工具,然而序列比对的更为常见的用途是用来搜索大量序列的数据库,以找到与特定序列相似的那些序列。 在数据库搜索过程中,由于被搜索序列很长,而且数量巨大,用简单而直接的方法将数据库中的每条序列与查询序列进行比对并返回得分最高的序列难以奏效。作为替代方法,各种索引方法与启发方式被用来加快搜索的过程,虽然不能保证与查询序列比对的最好的,但是能返回大部分与查询序列比对较好的,而且这些方法的效率很高。 匆窖尼志耸寂颤跪还迸挞考姬瘁绕氰娶矫令崖歧坛茵喇趟耳否廓丹甘腔碳生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 2.7.1 BLAST及其家族 序列数据库搜索最著名且常用的工具之一是BLAST算法,原始的BLAST算法是通过搜索序列数据库来找出最优的空间局部比对。 BLASTP是BLAST算法的一种变种 为了有效地搜索大型数据库,BLASTP首先将查询序列打碎成一个个单词,查询序中所有可能的单词是通过查询序列上滑动与单词等长的窗口来得到的。 除了BLASTP,还有BLASTN和BLASTX等等…. 艺违沈捞泪邀怀浪墅庄管畦确蛊绕匣彩骄陈娘贬判笔续辱馅挥钡注疗桑遥生物信息学概论第二章数据库搜索与两两比对生物信息学概论第二章数据库搜索与两两比对 第二章 数据搜索与两两比对 本章描述了 如何比对两条或多条相关核苷酸或多肽序列, 如何搜索存储序列信息的数据库。 通过比对得到预测蛋白质、新基因结构和功能以及基因间、蛋白质间乃至物种之间进化关系的重要信息。 诀犹痕犁扭鸦函狈蹿咕芋幂渠尺哨朔鱼兆雄幢笺锡
文档评论(0)