2015-3Blast搜索与序列比对详解.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2015-3Blast搜索与序列比对详解

2017-4-3 1 第三章 序列比对与Blast搜索 滕虎 《生物统计学与生物信息学》 大连理工大学生命科学与技术学院 2017-4-3 2 教学内容 序列分析 生物信息数据库介绍 二重序列比对与Blast应用 多重序列比对与ClustalX应用 蛋白质序列分析 电子克隆 基因预测 分子进化分析 大分子结构分析 大分子结构预测 分子动力学/计算量子化学 分子相互作用分析 后基因组学/系统生物学 系统生物学基础 大规模网络分析 基因芯片分析 生物系统动力学分析 2017-4-3 3 第一节 序列比对基础 2017-4-3 4 一切从序列比对开始:BLAST搜索 2017-4-3 5 “AB012771”查询结果 2017-4-3 6 相似序列比对情况 2017-4-3 7 序列比对是生物信息分析的基础 2017-4-3 8 设有两个序列: GACGGATTAG,GATCGGAATAG Alignment2: GA—CGGATTAG GATCGGAATAG Alignment1: GACGGATTAG- GATCGGAATAG 1、什么是序列比对(Alignment) 序列比对是指将多个序列中各个字符(碱基或氨基酸)进行对比排列,建立一种一一对应关系,并尽可能反映序列间的相似性。 Alignment:比对、对位排列、联配、对齐 2017-4-3 9 通过点矩阵进行序列比对 “矩阵作图法” 或 “对角线作图” 在两个对角线方向上的连续点连接起来,就构成了一个比对方案 反向序列矩阵标记图 多个相同子序列的矩阵标记图 2017-4-3 10 2、序列比对计算的标准化处理 序列的表示问题:字母表和序列 序列的处理方法:编辑操作 序列相似性的评价:打分矩阵 1: A-TTCGAGCCT- | | | | | | | 2: CGTTC- AGC- TA 2017-4-3 11 (1)序列表示问题——字母表和序列 将生物分子序列抽象为字符串,其中的字符取自特定的字母表。 ATTCGAGCCT 字母表 4字符DNA字母表:{A, C, G, T} 单字母氨基酸编码 扩展的遗传学字母表或IUPAC编码 上述字母表形成的子集 2017-4-3 12 符 号 含 义 说 明 G G Guanine A A Adenine T T Thymine C C Cytosine R G or A Purine Y T or C Pyrimidine M A or C Amino K G or T Keto S G or C Strong interaction (3 H bonds) W A or T Weak interaction (2 H bonds) H A or C or T Not-G B G or T or C not-A V G or C or A not-T(not-U) D G or A or T not-C N G or A or T or C Any 扩展的遗传学字母表或IUPAC编码 2017-4-3 13 氨基酸名称 英文缩写 简 写 氨基酸名称 英文缩写 简 写 甘氨酸 Gly G 丝氨酸 Ser S 丙氨酸 Ala A 苏氨酸 Thr T 缬氨酸 Val V 天冬酰胺 Asn N 异亮氨酸 Ile I 谷酰胺 Gln Q 亮氨酸 Leu L 酪氨酸 Tyr Y 苯丙氨酸 Phe F 组氨酸 His H 脯氨酸 Pro P 天冬氨酸 Asp D 甲硫氨酸 Met M 谷氨酸 Glu E 色氨酸 Trp W 赖氨酸 Lys K 半胱氨酸 Cys C 精氨酸 Arg R 20种标准氨基酸的英文简写 2017-4-3 14 (2)字符编辑操作-序列处理方法 字符编辑操作可将一个序列转化为一个新序列 GCATGACGAATCAG- ????? ?? ??? -TATGAC-AAACAGC Match(a,a)字符匹配 Delete(a,-) 1序列删除1个字符a,或2插入空位 Replace(a,b)2序列字符b替换1序列字符a Insert(-,b)1序列插入空位,或2删除1个字符b 2017-4-3 15 扩展的编辑操作 ACCGACAATATGCATA ? ? ? ? ? ATAGGTATAACAGTCA ACCGACAATATGCATA ?? ????????? ??? ACTGACAATATGGATA 第二条序列头尾颠倒 CTAGTCGAGGCAATCT ? ? GAACAGCTTCGTTAGT ? CTAGTCGAGGCAATCT ?? ????? ?????? C

文档评论(0)

bbnm58850 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档