网站大量收购独家精品文档,联系QQ:2885784924

BLAST相关术语及参数详解.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BLAST相关术语及参数详解

Alignment: 序列比对。将两个或多个序列排在一起,以达到最大一致性的过程(对于氨基酸序列是比较它们的保守性),这样可以评估序列间的相似性和同源性。 Algorithm: 算法。在计算机程序中包含的一种固定过程。? Bit score: 二进制。二进制值S'源于统计性质被数量化的打分系统中产生的原始比对分数S。由于二进制值相对于打分系统已经被标准化,它们常用于比较不同搜索之间的比对分数。 BLOSUM: 模块替换矩阵。在替换矩阵中,每个位置的打分是在相关蛋白局部比对模块中观察到的替换的频率而获得的。每个矩阵被修改成一个特殊的进化距离。例如,在BLOSUM62矩阵中,是使用一致性不超过62%的序列进行配对来获得打分值的。一致性大于62%的序列在配对时用单个序列表示,以避免过于强调密切相关的家族成员。 Conservation: 保守。指氨基酸或DNA(普遍性较小)序列某个特殊位置上的改变,并不影响原始序列的物理化学性质。 Domain: 结构域。蛋白质在折叠时与其他部分相独立的一个不连续的部分,它有着自己独特的功能。 DUST: 一个低复杂性区段过滤程序。 E value: E值。期望值。在一个数据库中所搜索到的打分值等于或大于S的不同比对的个数。E值越低,表明该打分值的显著性越好。 Filtering: 过滤,也叫掩蔽(masking)。指对那么经常产生乱真的高分数的核苷酸或氨基酸序列区域进行隐藏的过程。 Gap: 空位。在两条序列比对过程中需要在检测序列或目标序列中引入空位,以表示插入或删除。为了避免在比对时出现太多的空位,可以在收入空位的同时,从比对的打分值中减去一个固定值(空位值)。在多余的核苷酸或氨基酸周围引入空位时,也要对比对的打分值进行罚分。 Global Alignment: 整体联配。对两个核苷酸或蛋白质序列的全长进行的比对。 H: 相对熵值。目标残基和底物残基频率的相对熵记作H。H可以衡量某个位置(这个位置可以通过概率来区分比对)上由于偶然因素而得到的平均信息(用字节表示)。H值越高,短的比对就越可以通过概率来区分;H值越低,需要的比对长度越长。 Homology: 同源性。由共同的祖先所遗传得到的相似性。 HSP: High-scoring segment pair,高打分值片段。在一个给定的搜索中,没有空位的局部比对能得到最高的比对打分值。 Identity: 一致性。两个(核苷酸或氨基酸)序列比对时不变部分的长度。? K: K值。用来计算BLAST程序中打分函数的一个统计参数。它可以看作搜索空间大小的一个自然衡量尺度。K值通常用于将原始比对值S转换为二进制值S'。 Lambda: λ值。用来计算BLAST程序中打分函数的一个统计参数;它可以看作打分系统的一个自然衡量尺度。λ值通常用于将原始比对值S转换为二进制值S'。 Local Alignment: 局部联配。对两个核苷酸或蛋白质序列的一部分所进行的比对。 Low Complexity Region(LCR): 低复杂性区域。指组分(包括均聚物、短周期重复片段)区域和有许多单个或多个残基的区域。SEG程序用来筛选或过滤氨基酸序列中低复杂性区域。DUST程序用来筛选或过滤核苷酸序列中的低复杂性区域。 Masking: 掩蔽。也叫过滤(filtering),指为了提高对序列相似性搜索是时的敏感性,而从序列中移除重复的或低复杂性区域的过程。 Motif: 模体或序列模式。蛋白质序列中短的保守区域。它们是结构域中保守性很高的部分。 Multiple Sequence Alignment: 多序列比对。三个或三个以上的多个序列之间的比对,如果序列在同一列有相同结构位置的残基和(或)祖传的残基,则会在该位置插入空位。ClustalW是一种最为广泛使用的多序列比对程序之一。 Optimal alignment: 最佳联配。两个序列之间有最高打分值的排列。 Orthologous: 直系同源。指不同种类的同源序列,它们是在物种形成事件中从一个祖先序列独立进化形成的;可能有相似功能,也可能没有。 P value: P值。在比对时,获得某个打分值或更高的打分值的可能性。通过数据库中具有相同长度或组分的随机序列之间的比对,可以得到高打分值的片段的预期分布,将它与观察到的比对打分值S相连,就可以计算出P值。显著性最高的P值应该接近于零。P值和E值用不同的方法来表示比对的显著性。 PAM: Percent Accepted Mutation,可接受点突变。一个用于衡量蛋白质序列的进化突变程度的单位。一个PAM的进化距离表示蛋白质序列中平均1%的氨基酸残基发生突变的概率。PAM(x)替换矩阵是一个查找表,其中每个氨基酸残基的替换打分值是基于进化趋异程度为x的紧密相关蛋

文档评论(0)

hhuiws1482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档