- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
任何情况下我们都是对一段连续的相似残基感兴趣,而对随机匹配不感兴趣,也就是对沿着对角线的匹配感兴趣。我们可以设一个最小的对角线长度,比如说10个连续的残基,这样一来就可以消除随机的点,这就叫一个“window”(窗口)。要求至少有这么长的相似区段才去考虑它,但这样一来又会排除了一些低相似度或散布的相似区段。我们可以通过允许在“window”中有一些不匹配的残基,从而得到更加精确的结果。因此在相似的地带容纳一些小的不匹配区,这就是我们通常所称的“严谨度”(stringency)。就象杂交实验的洗涤一样,严谨度越高,留在膜上的越是相似的序列。 以下例子的window大小为21,严谨度为14。这就是说,被选出的相似区大小为21残基,其相似的分值最小为14。严谨度通常以最小分值给出,即比较时window最少达到该相似度才被认为是与分析相关的。需要指出的是,分值是根据打分距阵的值计算出来的。然后将window中各残基的分值相加。于是,严谨度越高,被接受为显著相似的匹配window的相似度越高。 序列比较的生物学基础 序列比较的生物学基础 4种核苷酸组成64个三联密码子。 4种核苷酸可以组成64个不同的三联密码子(triplet codes),用于编码20种氨基酸绰绰有余。其中三个为终止密码子,代表多肽序列的末端,一种氨基酸可以由1~6个三联密码子编码。由多个密码子编码的氨基酸,不同密码子的使用频率并不相等,这种使用频率的不同分布称为“密码子偏好”(coden usage)。不同种的生物密码子偏好不同。 序列比较的生物学基础 形成6个开放读码框 由于氨基酸是由三联密码子编码的,因此DNA序列就包含三个不同的开放读码框,取决于从第一、第二或第三位核苷酸开始(第四位和第一位同框)。而双链DNA的两条链都可以转录RNA,后者翻译蛋白质。因此,一个DNA序列及其互补链可以有6个不同的读码框(reading frames)。 序列相似性的概念 序列对比(aligment)是序列分析的基础,其他很多研究(如数据库搜索)都建立在序列对比的基础上。 ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCAAGCTGCTAGCTAG ACGCTAGCGC AGCTGCTAGCTAG 序列相似性的概念 序列对比的目的: 是初步蛋白质功能推断的基础 可用于蛋白质三级结构的预测 可用于推导进化树和解释种间亲缘关系 用于分析分子水平的选择压力(selective pressure) 探测序列之间的相互关系 探测启动子等基因调控单元 序列相似性的概念 序列排对比具有上述强大功能的原因是,人们发现,假如两个生物大分子的序列足够相似,几乎毫无疑问(当然不是绝对)它们具有相似的生物学功能,并且可能是同源的。 序列相似性的概念 在序列中编码功能的句法和语义中具有两个重要的特征: 功能被编码于序列之中,即序列提供了句法。 编码具有一定的冗余度(redundancy),即序列中一些位点的改变可以保持功能不变,这就使编码具有强劲的语义。 序列相似性的概念 在对一个新测定的DNA序列进行分析时,比如分析的结果是:这个序列与某种细菌的ATPase相似。这是否意味着这个未知序列就是一个ATPase?答案是不能确定的,但很有可能。 所以就必须完全理解在序列水平上“相似性”或“同源性”是如何定义的? 序列对比是如何进行的? 一致性(identity): 两个蛋白质有一定数量的氨基酸在对比的位点上是相同的,即如果38个氨基酸的蛋白质中15个位点相同,我们说它们39.4%相同(39.4%) MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG -------------PRNGTIKIYENPARTFTRPYSAKNITIYKEND 序列比较是如何进行的? 相似性(similarity): 通常在某些位点上有一些氨基酸被另外一些化学物理特性相近的氨基酸所代替,这种突变可称为保守突变。将保守突变的因素考虑在内,就可以定义各种打分方案(scoring schemes)对两序列的相似程度打分,所得分值即代表其相似的程度。 序列比较是如何进行的? 同源性(homology): 只有当两个蛋白质在进化关系上具有共同的祖先时,才可称它们为同源的。 序列比较是如何进行的? 要分析两个序列是否相似,必须首先作对比分析(alignment)。 如何作对比分析? 最基本的条件是对序列的相似性做定量分析,然后将序列进行排比,在排比中要用到: Gaps (间距)或Insertions(插入), Su
您可能关注的文档
最近下载
- 机械制图习题集(第7版)钱可强课后习题答案.pdf
- 学堂在线网课《生活英语读写》课后作业单元考核答案.docx VIP
- CCES 02-2004 自密实混凝土设计与施工指南.pdf VIP
- 儿童闭塞性细支气管炎的诊断和治疗专家共识2023.pptx
- 学堂在线 中国共产党与中华民族伟大复兴 期末考试答案.docx VIP
- 2020年第三单元 百年追梦 复兴中华.ppt VIP
- 小学法制安全教育课件.ppt VIP
- 《芣苢》《插秧歌》课件.pptx VIP
- 《C语言程序设计教程》PPT完整全套教学课件.pptx VIP
- 初中地理八上3中国的自然资源优质课金奖课件市公开课一等奖课件名师大赛获奖课件.pptx VIP
文档评论(0)