3.4序列两两比较打点法-03-dotlet应用实例.pdf

3.4序列两两比较打点法-03-dotlet应用实例.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《生物信息学》第三章:序列比较(第一部分) 序列两两比较之打点法:Dotlet 应用实例 图 1 是上一节中 seq1 自己和自己打点计算出的打点图。注意默认的颜色方案是在越相 似的地方打的点的颜色越浅,越不相似的地方颜色越深。所以整体感觉像是在一张黑纸上打 白点。因为是 seq1 自己和自己打点,所以应该有一条明显的主对角线,这是所有自己和自 己打点的序列都会出现的情况。除此之外,还有一条与主对角线平行的次对角线,涉及 seq1 大约 1/2 的长度。这说明 seq1 的前半部分和后半部分非常的相似! 图 1. Seq1 自己和自己打点计算出的打点图 我们把鼠标点在这条次对角线上的任意位置,之后就可以从下面的序列显示区域看到, 这一点,对应横着这条 seq1 的位置 153 开始的这一段,同时对应竖着这条 seq1 的位置 11 开 始的这一段。为什么这一点对应的是一段呢?因为我们这里选的单元长度是 15,也就是一 次比较 15 个字母。从这里也可以看出,如果把 seq1 的前半段和后半段重合起来的话,它们 是完全一样的序列。 图 1 右边给出了打点所用的参数设置。按照选定的替换计分矩阵和单元长度计算,比较 所能打出的最高分是 165 分,最低分是-60 分。默认的颜色方案是灰度从 0%到 100%。也就 是最高分 165 分的点具有 100%的灰度,即纯白色;最低分-60 分具有 0%的灰度,即纯黑色。 参数下面的图给出了各个分值的点的个数。横坐标是分值,从-60 到 165,纵坐标是得某一 分值的点的个数。我们可以看到绝大多数点的分值都是较低的,也就是绝大多数位置的比较 结果都是不相似的。只有少数对角线上的比较才是高分值的点,因为这些位置对应的是相似 的区域。这个情况反映在打点图上就是,绝大多数点都是深色的,只有少数点是浅色的,这 些浅色的点位于主对角线和两条对称的次对角线上。 这里我们可以通过调整灰度条,来屏蔽大多数低分值的点,让他们统统变成黑色背景, 并且强化高分值的点,让他们以纯白色突出显示出来(图 2)。 图 2. 调整灰度条改变打点图显示效果 上一个例子只是让大家熟悉一下 Dotlet 的使用界面及结果的查看方法,并没有实际的生 物学意义。在下面的一个实际例子里,我们比较两条不同的序列,看看它们是否相似。首先 从附件文件 dotlet2.fasta 中将 seq2 和 seq3 两条序列 input 进来。水平序列选 seq2,垂直序列 选 seq3,其他参数不变,点计算按钮。虽然这次的主对角线不如上一个例子里的明显,但是 我们还是可以一眼就看出它来(图 3)。说明这两条序列整体上十分相似。通过调整显示方 案可以让主对角线清晰呈现。 图 3. Seq2 和 seq3 打点计算出的打点图 下面我们再来看一个用 Dotlet 找串联重复序列的例子。找某条序列中存在的串联重复序 列肯定是序列自己和自己打点。用到的序列在 dotlet3.fasta 文件中。输入序列,起名为 seq4。 水平和垂直序列都选择 seq4,其他参数不变,点计算按钮。 这时我们看到除去主对角线外,还有很多条对角线(图 4)。说明序列中存在串联重复 序列。前面我们讲过,半个矩阵范围内,数数包括主对角线在内,有多少条等距平行线,就 说明重复了多少次,最短的平行线就是一个重复单元。 图 4. Seq4 自己和自己打点寻找串联重复序列

文档评论(0)

恬淡虚无 + 关注
实名认证
内容提供者

学高为师,身正为范.师者,传道授业解惑也。做一个有理想,有道德,有思想,有文化,有信念的人。 学无止境:活到老,学到老!有缘学习更多关注桃报:奉献教育,点店铺。

1亿VIP精品文档

相关文档