- 7
- 0
- 约2.21万字
- 约 98页
- 2019-11-06 发布于广东
- 举报
Biocomputing technology— Multiple sequence alignment 思考题 (3) 13. 多重序列比对的特征统计矩阵的概念 14. HMM模型的基本原理 15. HMM的三个经典问题是什么? 这三个问题用什么算法解决? 算法的原理是什么? 图4.19 4.20 Biocomputing technology— Multiple sequence alignment Biocomputing technology— Multiple sequence alignment HMM的三个经典问题: Biocomputing technology— Multiple sequence alignment 问题1(评测问题,evaluation): 已知模型 和输出序列O,求由 生成O的概率。 问题2(译解问题,decoding): 已知模型 和输出序列O,求最有可能生成O的状态 转移序列。 问题3(学习问题,learning): 已知模型 和输出序列O,求最有可能生成O时模型 的参数。 Profile——概形、谱 Biocomputing technology— Multiple sequence alignment * 概形是对一组序列进行全局多重比对时被发现的,是将比对 中具有较高保守区域变成小的多重比对,然后得到多重比对 记分矩阵. * 概形由更像小的多重排列的列构成,可以包括: 匹配、失配、 插入、缺失. * 概形一旦生成,就可用于寻找一个可能与之匹配的目标序列, 它利用表中记分来评价每个位置的可能性. 例: 25个氨基酸长的概形表格,有25列,每列将有20个记分值. 一列中每个匹配氨基酸的记分都在概形中对应的位置上. 缺点:偏向性 Profile HMM (1) 模型结构 Biocomputing technology— Multiple sequence alignment * 对于生物序列而言,HMM的字符当然是20个字母的氨基酸 或4个字母的核苷酸。但依据不同的问题,其它的一些字符 也可以使用,如64个密码子的三联体字母,3个字母(α,β, coil )的二级结构等. * 编码蛋白质的原始DNA序列,在生物的进化过程中会受到 自然环境和各种因素的影响,使翻译出的蛋白质序列经历 突变、遗失或引入外源序列等变化,最后按不同的进化路 径分化,形成多种功能相近的蛋白质。 所以,可以把这些蛋白质看作由一个基本蛋白质序列经过插 入、删除或替换了某些氨基酸残基而形成的。这个过程可以 用HMM来表示。 图4.9 Biocomputing technology— Multiple sequence alignment 图中: 方形代表匹配状态(主状态),即输出的氨基酸和基本序列中对应 的氨基酸匹配; 圆形表示删除或缺失状态,即从原始蛋白质序列中去掉一个特定 的氨基酸。 菱形表示氨基酸的插入,即在原始蛋白质序列插入一个氨基酸。 各状态间的箭头表示状态间的转换途径。 注意: ① 不同的参数会使模型以不同的概率产生新的氨基酸。 ② 一个训练好的模型可以代表有共同特征的蛋白质序列。 图4.10 Biocomputing technology— Multiple sequence alignment Profile HMM 与标准的Profile的比较 Biocomputing technology— Multiple sequence alignment ① Profile HMM有正规的概率作基础,对于序列的删除和 插入状态的记分也有较为可靠的理论依据。而标准的 Profile纯粹是一种启发式的方法。 ② HMM用统计方法估计序列某一位点核苷酸或氨基酸残基 出现的真正概率,而标准的Profile却是用自身的观察频率 给核苷酸或氨基酸残基指派分数。 ③ 由于②,Profile HMM方法从10至20个核苷酸序列构成的 比对中提取的信息,相当于用标准的Profile从40至50个 核苷酸序列构成的比对中提取的信息。 (2) 用HMM给序列打分 Biocomputing technology— Multiple sequence alignment * 因训练好的HMM代表一个蛋白质家族,我们可以用它对序 列进行打分,根据分值来衡量这条序列是否属于由此HMM 代表的蛋白质家族。 得分高于阈值,证
您可能关注的文档
最近下载
- 河道整治工程施工质量创优计划的实施效果评估与改进策略.docx VIP
- 水利工程质量创优方案(3篇).docx VIP
- 110kv变电站的设计毕业设计(论文).docx VIP
- 华中师范大学《C++程序设计》2020-2021学年第一学期期末试卷.pdf VIP
- 电力系统仿真:电力系统暂态仿真all.docx VIP
- 电力系统暂态稳定性仿真研究毕业设计(论文).docx VIP
- 3 浮力——液面升降问题(原卷版).docx VIP
- 核心素养视域下的初中数学单元作业设计研究.docx VIP
- 纪念红军长征90周年演讲稿(2025年最新版).pptx VIP
- 2002-2012 十年北京卷高考语文试卷深度解析.pdf VIP
原创力文档

文档评论(0)