- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学概论数据库搜索与两两比对
途中箭头指示了部分打分表中的合法路径,每条路径代表若干等价最优比对 路径自右下至左上排列自来分别是↖ ↖ ↖ ↑ ↑ ↖ ↖ 根据这条线路,可以重建比对,可以得到以下这个得分为2的最优比对 A C T C G 2.6 全局对比与局部比对2.6.1 准全部比对 到目前为止,所有讨论的基本比对算法仅是做了全局比对。而比对两序列时,这并不总是可取的。假如从AAACACGTGTCT中搜寻段序列ACGT。在若干种两序列比对中,我们需要的是区别对待末端空位与序列内部空位 这种比对称为准全局比对 (semiglobal alignment) 准全局比对 (1) 通过初始化部分打分表,表格第一行与第一列为零; (2) 允许表格最后一行与一列横向与纵向的移动不被罚分; Needleman 和 Wunsch 算法的改进 (准全局比对) 2.6.2 Smith-Waterman算法 准全局比对有时有点不能为序列搜索提供所需的适应性 需要进行局部比对 例如:两条序列 AACCTATAGCT 和 GCGATATA,用准全局比对算法,空位罚分为-1, 匹配奖励为+1,失配得分为-1,得: 局部比对时,表中小于零的位置用零代替 AACCTATAGCT GCGATATA A A C C T A T A G C T 2.6.2 Smith-Waterman算法 局部比对 1981年,由F. Smith 和 M. Waterman首次提出; 动态规划方法通过较少的改动便可以用来识别匹配的子序列, 并且忽略匹配区域之前或之后的失配和空位; 局部比对时,表中小于零的位置用零代替; 得到的局部比对代表了被比两条序列间的最佳的匹配子序列; 局部比对方法可以识别子序列的匹配,而这是全局与准全局比对不可能做到的。 2.7数据库搜索 尽管序列比对是比较两条已知序列的极为重要的工具,然而序列比对的更为常见的用途是用来搜索大量序列的数据库,以找到与特定序列相似的那些序列。 在数据库搜索过程中,由于被搜索序列很长,而且数量巨大,用简单而直接的方法将数据库中的每条序列与查询序列进行比对并返回得分最高的序列难以奏效。作为替代方法,各种索引方法与启发方式被用来加快搜索的过程,虽然不能保证与查询序列比对的最好的,但是能返回大部分与查询序列比对较好的,而且这些方法的效率很高。 2.7.1 BLAST及其家族 序列数据库搜索最著名且常用的工具之一是BLAST算法,原始的BLAST算法是通过搜索序列数据库来找出最优的空间局部比对。 BLASTP是BLAST算法的一种变种 为了有效地搜索大型数据库,BLASTP首先将查询序列打碎成一个个单词,查询序中所有可能的单词是通过查询序列上滑动与单词等长的窗口来得到的。 除了BLASTP,还有BLASTN和BLASTX等等…. BLASTP搜索算法概述 2.7.2 FASTA及其相关算法 FASTA算法及家族成员能够进行序列间含空位的局部比对。 FASTA搜索非常细致,需要时间也长的多。 FASTA搜索也是将搜索序列打碎成单词。 对于氨基酸序列FAMLGFIKYLPGCM,假设单词长度为1,那么: 目标序列TGFIKYLPGACT,那么 对照表格发现,甘氨酸( G )在第一个表中位置为5、12,在第二个表中为 -4、3,再观察其它出现了很多距离为3的情况,这一现象暗示了一个可能的合理比对。 通过两条序列的偏移表,即可发现相同的区域。 单词 A C D E F G H I K L M N P Q R S T V W Y 位置 2 13 1 5 7 8 4 3 11 9 6 12 10 14 1 2 3 4 5 6 7 8 9 10 11 12 T G F I K Y L P G A C T 3 -2 3 3 3 -3 3 -4 -8 2 10 3 3 3 2.7.3 数据库搜索的比对得分与统计显著性 数据库搜索引擎一般都为每个搜索结果提供P得分和E得分 加入搜索结果的比对得分为S,那么P和E得分指的是用于随机找出的一条或多条序列,比对得分大于等于S的可能性。 P与E的值比较低说明该结果与查询序列具有进化上的关系。 2.8 多重序列比对 (multiple sequence alignment) 到目前为止,所讨论的比对算法都是为进行序列两两比较而设计的,然而同时比对多条序列也是很重要的。当统计一组序列的替换率时,多重序列比对通常比两两比对更合适,因为多重比对尽可能地多考虑到了序列中的空位。 多重比对对于打
您可能关注的文档
- 现代大厦1-2楼平面图划分.现代大厦1-2楼平面图划分.ppt
- 环境工程设计基础设计基础资料.ppt
- 现代学校教育的本基逻辑.ppt
- 现代市场营销学市场营销环境.ppt
- 现代广告学的学科体系及其基本原理.ppt
- 现代性的诊断一个反进化论视角.ppt
- 现代广告的实施策略及效果评估.ppt
- 现代幼儿育教的基本观念.ppt
- 现代文阅读(说明文).ppt
- 现代教育社的会功能.ppt
- 人教版八年级上册数学精品教学课件 第十三章 三角形 章末整合练.ppt
- 人教版八年级上册数学精品教学课件 第十五章 轴对称 15.3 等腰三角形-15.3.1 等腰三角形-第2课时 等腰三角形的判定 (4).ppt
- 人教版八年级上册数学精品教学课件 极速提分法 第17招 整体思想在解题中的七种技巧.ppt
- 人教版八年级上册数学精品教学课件 第十五章 分式 专项突破9 分式方程的解在求字母的值或取值范围中的常用技巧.ppt
- 人教版八年级上册数学精品教学课件 第十八章 分式 18.3 分式的加法与减法-第1课时 分式的加减.ppt
- 人教版八年级上册数学精品教学课件 第十四章 全等三角形 14.1 全等三角形及其性质 (4).ppt
- 七年级作文成长的经历(11篇).docx
- 法律责任豁免声明及工作证明函(6篇).docx
- 叙事作文那是一次难忘的尝试750字通用14篇.docx
- 沙滩里的秘密500字(14篇).docx
文档评论(0)