生信概论chap5-1.pdf

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生信概论chap5-1

生物信息学概论 生物信息学概论 第五章序列模式识别(1) Bioinformatics, 2014, HUST 生物信息学:预测 生物信息学:预测 生物信息学:预测  1. 生物信息学最核心的问题:预测 2. 生物信息学工具的作用:预测 3. 生物信息学所有的分析:预测 4. 基本假设(贝叶斯的哲学理念):我们能够通过 对已知世界的观察,总结经验,并以此来预测未 知世界已经存在或者即将发生的事物/事件 5. 在生物信息学中的应用:对现有的数据,使用 合适的算法,进行训练,构建计算模型和计算工 具,预测未知的现象 Bioinformatics, 2014, HUST 序列模式 序列模式 序列模式 1. 功能结构域,functional domain 2. 模块,BLOCK 3. 模体,motif 4. 模式,pattern/profile Bioinformatics, 2014, HUST 功能结构域 功能结构域 功能结构域 1. 具有完整的、独立的三级结构 2. 具有特定的生物学功能 3. 一般长度,几十到几百个氨基酸 4. 允许插入/缺失,即允许存在gap Bioinformatics, 2014, HUST 模块/BLOCK 模块/BLOCK 模块/BLOCK  1. 几个到几十个氨基酸 2. 无gap,从全局多序列比对的结果直接处理得到 3. 描述蛋白质家族或者一类蛋白质的序列保守性 BLOCK Bioinformatics, 2014, HUST 模体/Motif 模体/Motif 模体/Motif  1. 不具有独立的三级结构 2. 具有特定的生物学功能:结合,修饰,细胞亚定 位,维持结构,等 3. 长度一般几个到几十个氨基酸或者碱基; 4. 例如,SUMO化的序列模体:Ψ-K-X-E (Ψ:A, I, L, V, M, F, P; X: 任意氨基酸) Bioinformatics, 2014, HUST 模式/Pattern/Profile 模式/Pattern/Profile 模式/Pattern/Profile 1. 在算法上用来描述一类功能结构域,模体 或者模块的表示方式 2. 根据序列数据,构建的预测模型 3. 数据形式:概率表示 4. 用来预测新的可能符合特定模式的序列 5. 例如,直接将Ψ-K-X-E视为SUMO化位点 的,普适的“模式”,则可以预测所有包含该 模式的蛋白质序列 Bioinformatics, 2014, HUST 本章内容提要 本章内容提要 本章内

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档