- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《生物信息学》第三章:序列比较(第一部分)
序列两两比较之打点法:Dotlet 应用实例
图 1 是上一节中 seq1 自己和自己打点计算出的打点图。注意默认的颜色方案是在越相
似的地方打的点的颜色越浅,越不相似的地方颜色越深。所以整体感觉像是在一张黑纸上打
白点。因为是 seq1 自己和自己打点,所以应该有一条明显的主对角线,这是所有自己和自
己打点的序列都会出现的情况。除此之外,还有一条与主对角线平行的次对角线,涉及 seq1
大约 1/2 的长度。这说明 seq1 的前半部分和后半部分非常的相似!
图 1. Seq1 自己和自己打点计算出的打点图
我们把鼠标点在这条次对角线上的任意位置,之后就可以从下面的序列显示区域看到,
这一点,对应横着这条 seq1 的位置 153 开始的这一段,同时对应竖着这条 seq1 的位置 11 开
始的这一段。为什么这一点对应的是一段呢?因为我们这里选的单元长度是 15,也就是一
次比较 15 个字母。从这里也可以看出,如果把 seq1 的前半段和后半段重合起来的话,它们
是完全一样的序列。
图 1 右边给出了打点所用的参数设置。按照选定的替换计分矩阵和单元长度计算,比较
所能打出的最高分是 165 分,最低分是-60 分。默认的颜色方案是灰度从 0%到 100%。也就
是最高分 165 分的点具有 100%的灰度,即纯白色;最低分-60 分具有 0%的灰度,即纯黑色。
参数下面的图给出了各个分值的点的个数。横坐标是分值,从-60 到 165,纵坐标是得某一
分值的点的个数。我们可以看到绝大多数点的分值都是较低的,也就是绝大多数位置的比较
结果都是不相似的。只有少数对角线上的比较才是高分值的点,因为这些位置对应的是相似
的区域。这个情况反映在打点图上就是,绝大多数点都是深色的,只有少数点是浅色的,这
些浅色的点位于主对角线和两条对称的次对角线上。
这里我们可以通过调整灰度条,来屏蔽大多数低分值的点,让他们统统变成黑色背景,
并且强化高分值的点,让他们以纯白色突出显示出来(图 2)。
图 2. 调整灰度条改变打点图显示效果
上一个例子只是让大家熟悉一下 Dotlet 的使用界面及结果的查看方法,并没有实际的生
物学意义。在下面的一个实际例子里,我们比较两条不同的序列,看看它们是否相似。首先
从附件文件 dotlet2.fasta 中将 seq2 和 seq3 两条序列 input 进来。水平序列选 seq2,垂直序列
选 seq3,其他参数不变,点计算按钮。虽然这次的主对角线不如上一个例子里的明显,但是
我们还是可以一眼就看出它来(图 3)。说明这两条序列整体上十分相似。通过调整显示方
案可以让主对角线清晰呈现。
图 3. Seq2 和 seq3 打点计算出的打点图
下面我们再来看一个用 Dotlet 找串联重复序列的例子。找某条序列中存在的串联重复序
列肯定是序列自己和自己打点。用到的序列在 dotlet3.fasta 文件中。输入序列,起名为 seq4。
水平和垂直序列都选择 seq4,其他参数不变,点计算按钮。
这时我们看到除去主对角线外,还有很多条对角线(图 4)。说明序列中存在串联重复
序列。前面我们讲过,半个矩阵范围内,数数包括主对角线在内,有多少条等距平行线,就
说明重复了多少次,最短的平行线就是一个重复单元。
图 4. Seq4 自己和自己打点寻找串联重复序列
您可能关注的文档
- 1.2热力学第一定律、焓和焓变.pdf
- 1.2探索生物信息学神秘岛-01.pdf
- 1.3 偏差生物化学.pdf
- 1.3 肉足纲代表动物及其主要特征.pdf
- 1.3热化学方程式、盖斯定律.pdf
- 1.4 数据的取舍和运算规则.pdf
- 1.4生成焓、化学反应热效应计算.pdf
- 1.4这门课学神马.pdf
- 1.5 纤毛纲代表动物及其主要特征.pdf
- 1.7第一章小结应用电化学.pdf
- 3.5序列两两比较比对法-01-什么是序列比对.pdf
- 3.7在线双序列比对工具-03-EMBL局部双序列比对工具.pdf
- 3.7在线双序列比对工具-04-其他在线双序列比对工具.pdf
- 3.8BLAST搜索-01-BLAST是怎么样工作的.pdf
- 3.9多序列比对介绍-01-用途和算法.pdf
- 3.10在线多序列比对工具-01-EMBL Clustal Omega.pdf
- 3.8BLAST搜索-06-其他BLAST生物化学.pdf
- 3.10在线多序列比对工具-02-TCOFFEE Expresso.pdf
- 3.8BLAST搜索-03-NCBI_BLASTp生物化学.pdf
- 3.10在线多序列比对工具-03-多序列比对的保存格式.pdf
文档评论(0)