- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
*/ 77 例题3.3 利用S-W算法对两条DNA序列进行局部比对。a=ATTCCAAG,b=TTCGAGT,得分系统:{4,-3,-4} 一、给动态规划矩阵赋初值。 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 - A T T C C A A G - T T C G A G T */ 77 例题3.3 (2)按照最优化的递归算法填充动态规划矩阵。 0 0 0 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 0 0 4 8 4 0 0 0 0 0 0 0 4 12 8 4 0 0 0 0 0 0 8 9 5 1 4 0 4 0 0 4 5 13 9 5 0 0 1 0 0 1 9 10 13 0 0 4 5 1 0 5 6 9 - A T T C C A A G - T T C G A G T */ 77 例题3.3 (3)从矩阵中分值最大的单元格开始,回溯到0为止得到最优比对路径。 0 0 0 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 0 0 4 8 4 0 0 0 0 0 0 0 4 12 8 4 0 0 0 0 0 0 8 9 5 1 4 0 4 0 0 4 5 13 9 5 0 0 1 0 0 1 9 10 13 0 0 4 5 1 0 5 6 9 - A T T C C A A G - T T C G A G T */ 77 BLAST2 */ 77 选择双序列比选项 Blastn为核酸序列的比对程序,blastp为蛋白质序列的比对程序。 */ 77 输入序列 输入序列1 输入序列2 NM_006744 NM_011255.2 */ 77 选择比对算法(程序)与参数 */ 77 算法选项 */ 77 结果1 */ 77 结果2 */ 77 结果3 */ 77 蛋白质 NP_006735 NP_001638 */ 77 复习思考题 1、什么是同源、直系同源、旁系同源?同源性和相似性有什么区别? 2、什么是序列比对、全局比对、局部比对?序列比对的关键问题是什么? 3、核酸序列比对的记分矩阵有几种?是列出这几种积分矩阵。 4、蛋白质序列比对的遗传密码矩阵和疏水矩阵是怎样得到的? 5、试述PAM和BLOSUM矩阵后面的数字与需要比对的序列之间相似性的关系。 6、什么是线性罚分和仿射罚分?计算公式是怎样的? 7、点阵法序列比对是怎样进行的?滑动窗口技术有什么作用? 8、 Needleman-Wunsch算法和Smith-Waterman 算法哪个是全局比对,哪个是局部比对? 9、用动态规划法找出两序列的所有最佳比对,要求写出详细过程。打分矩阵采用{(4,-3,-4},即匹配得4分,不匹配得-3分,空位得-4分。 序列1:AAAG,序列2:ACG */ 77 The END */ 77 三、序列比对的算法 点阵法 动态规划法 词或k串法(BLAST或FASTA中采用)。 */ 77 点阵法 点阵法是最基本的,也是很重要的一种可视化序列比对方法。 “矩阵作图法” 或 “对角线作图” 。 首先建立一个矩阵,两条序列的长度分别为矩阵的行数和列数,一条序列置于矩阵的顶部,一条序列置于矩阵的左侧。 把具有相同字符的单元做标记。 A C C T G A G C T C G T T A A C C A G C T A A */ 77 对角线上的元素 如果两个序列完全相同,则对角线上每个位置都会出现标记。 */ 77 其它位置的元素 其它位置如果出现连续的相同字符,同样可以在表中体现出来。 点阵图可以很直观的发现两条序列所有可能的匹配,这些匹配可能是某种功能域。也可用于寻找蛋白质或者DNA内部的重复或者反向重复区域 */ 77 反向重复序列 序列1 →序列2 → */ 77 滑动窗口技术 由于序列可能很长,而字符只有4个(核酸),所以会有很多随机性的没有生物学意义的相似性,这些是比对中的噪声。 使用滑动窗口代替一次一个位点的比较是解决噪声问题的有效方法。 假设窗口大小为10,相似度阈值为8,则每次比较取10个连续的字符,如相同的字符超过8个,则标记。 基于滑动窗口的点矩阵方法可以明显地降低点阵图的噪声,并且明确无误的指示出了两条序列间具有显著相似性的区域。 */ 77 滑动窗口的过滤 不连续的匹配可能是噪声,需要用滑动窗口过滤,滑动窗口有两个
文档评论(0)