- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多序列比对_I
7.91 –Lecture #2 Michael Yaffe
更多的成对序列比对
— 和
多序列比对
—
阅读:
文献: Mount pp. 8-9, 65-89, 96-115, 140-155, 161-170
要点大纲
递归和动力学设计
动力学设计应用:全局比对: eedleman-
Wunsch
动力学设计应用:局部比对:Smith-
Waterman
置换矩阵:PAM, BLOSUM, Gonnet
空位— 线形和affine
序列比对统计学
要优化一个序列比对需要知道什么
要点大纲 (续)
多序列比对: MSA, Clustal
阻断分析
特殊位置得分矩阵(PSSM)
例子
O ( K )是 “多项式时间”只要 K3… … 就
容易处理
考虑到非空位点阵全局比对:
…… 本质上是一个 O(mn) 矩阵
好的例子
2 3
O (n) 比O(n log(n)) ,O(n ), O(n ) 更好。
糟糕的例子
n
O(k ) = 指数时间…… . 恐怖 !!!!
P 问题 — 不知道多项式时间解决办法 =
非确定性多项式问题。
递归和动力学设计
比对两个没有空位的蛋白序列 — 大概是一个 O(mn) 问题。
没有空位 — 适合于计算天文学,直接比对方法不能做。 (=
22L/√(2πL); L= 序列长度 )
可选择的办法是比对所有可能的特征对 ( 配对和错配,也很好
的考虑到了空位,保持比对的数量的易处理性。) 这种方法也
叫动力学设计。在算术上证明了产生最佳比对。
需要置换或相似矩阵和考虑到空位的方法。
怎样记下比队得分的例子:写下两条序列
序列 #1
序列 #2
置换矩阵得分
得分 =Σ (AA 配对得分) - 缺口处罚
=15
BLOSUM 62 得分矩阵
得分系统应该:支持匹配识别或是相关氨基酸处罚错误匹配和
空位。
为了得到好的得分系统需要明确:在相关蛋白质与它的偶然产
生相比较中,特殊氨基酸对被发现的几率。替代矩阵中就包含
有这些信息……并且当有空位时,会有更好的选择。
真实替代矩阵的起源:
首先要知道在相关蛋白质中一个氨基酸替代另一个氨基酸的频
率 [=P(ab)] c/w 。另一个氨基酸偶然产生替代的机会,是以蛋
白质中每个氨基酸的相对频率为基础的,即q(a) 和 q(b) 。这
称为“不均几率”: P(ab)/q(a)q(b)
如果在比对中所有位置都进行了这种处理,那么总概率将会
是每个位置不均几率的乘积……但是乘法耗费计算空间……
因此… .. 取 log ( 不均几率 ) 再把它们相加,用此来代替。
像 PAM 和 BLOSUM 矩阵就是取了不均几率的对数。也包
含了反映相关蛋白质中的氨基酸替代的可能性的正数和负数
。
动力学设计过程:
首先沿着侧边从上到下写下一个序列。
注意 — 线形空位处罚: γ(n) =nA ,其中A= 空位处罚
动力学设计过程:
首先沿着侧边从上到下写下一个序列。
空位
空位
因此得到 S 必须知道 S(i-1, j-1) 和 S(i, j-
ij
1) and S(i-1, j)…… 因此需要回归。我们用
文档评论(0)