- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三讲 限制图谱及多重图谱
双消化问题(DDP) 当两种限制酶同时使用,DNA在两组限制模式的所有出现处被切割,得到一列双消化片段长度 c=‖A∧B‖={ci:1≤i ≤l}来自第一个分解 * 双消化问题(DDP) 用DDP(a,b,c)来表示求图谱[A,B]的问题,使得‖A‖=a, ‖B‖=b及 ‖C‖=‖A∧B‖=c 一般,‖A‖, ‖B‖和‖C‖是重集:可能有一些片段长的值出现不止一次 * 约定:集合‖A‖, ‖B‖和‖C‖是有序的,即:若:i≤j,有ai≤aj 对于集合‖B‖和‖C‖也一样 当然:∑ ai=∑ bi =∑ ci=L * 3.6.1 双消化问题的多重解 在许多实例中,双消化问题的解是不唯一的 举例P37 a=‖A‖={1,3,3,12},n=4 b= ‖B‖={1,2,3,3,4,6},m=6 c= ‖C‖={1,1,1,1,2,2,2,3,6} * A和B片段次序决定C=A∧B片段和这些片段次序 最简单是组合学给出n!*m!=4!*6!个图谱构形 * 3在A分解中重复2次, 3在B分解中也重复了2次 在不能区分长度相同片段情况下,上例中:n=4,m=6有(4!*6!)/(2!2!)=4320个图谱构形 * Kingman定理 概率论中非常有用的工具 双消化解的个数随长度指数级增长 * 概率算法与随机算法的应用 区别 在概率算法中,我们仅关心组合对象是否存在,若一个事件的发生概率为非零,就足够了 在随机算法中,算法性能是非常重要的,我们不能容忍非常小的成功概率。 * 随机算法在计算生物学中,可利用 Lovász局部引理来证明事件发生存在性 利用Markov和Chebyshev不等式来证明近似算法的有界性 * 假设有n个相互独立的事件,每个事件发生的概率至多是1/2,那么n个事件都不发生的概率至少是2-n Lovász局部引理将这个问题推广到了每个事件都和另外的一小部分事件非独立的情况。 * Kingman定理(次可加遍历) 对非负整数s,t, 0≤s≤t,设 Xs,t是一组随机变量,满足以下条件 (1)只要stu, Xs,u≤ Xs,t+Xt,u; (2){Xs,t}的联合分布与{Xs+1,t+1}的联合分布一 样 (3)期望gt=E[X0,t]存在,并对某个常熟K和所有t1 满足gt≥Kt,则有: limXs,t/t=m(m0)(t→∞)以 概率为 1存在且是一阶矩收敛 * 定理1 假设对两种酶,这些位点分别以概率pa,pb∈ (0,1)独立分布。设Ys,t是第s个和第t个重合切割位点间解的个数,则存在一个有限常数m0,使 limlog(Y0,t)/t=m(m0)(t→∞) * 定理2 假设对两种酶,这些位点分别以概率pa,pb∈ (0,1)独立分布。设Zl是从0开始到常为l的一段的解数,则: lim(log Zl /l)=m papb(m0)(l→∞) 则Zl ≈exp(m papbl)(l为DNA子片段长度)说明:双消化问题的解作为DNA片段长度的函数指数的增长 * 3.7 多重解分类 对于长的DNA有许多DDP的解,这样的结果困难性什么也不知道 不知道指数增长率、确定Kingman定理中常数K也很困难 具有多重解的小例子在极长的DNA中也存在。 * 3.7.1多重解的反射性 只要a,b是DDP(双消化问题)的解, 则a和b的转置a’,b’也是DDP的解,称:(a’,b’)是(a,b)的反射 * 3.7.2重叠等价 许多不同的图谱可能有同样的重叠数据,具有同一重叠数据的这些解称为重叠等价 * 重叠尺寸等价 图谱{a1,a2,…an}, {b1,b2,…bm}和 {c1,c2,…cl}的DD P两个解有同样一组重叠尺寸数据, 则称DD P两个解重叠尺寸等价 * 边的交错和欧拉路 一个路或回路的相继的边的染色不同,称为交错的 如果一个路或回路通过图的每条边恰好一次,则称该路是欧拉的 * 3.7.3 重叠尺寸等价 命题:当图谱{a1,a2,…an}和{b1,b2,…bm}每一个都有互不相同的元素,则重叠等价与重叠尺寸等价相同 片段的尺寸一般都是知道的 重叠等价推出重叠尺寸等价 * 3.7.4 Kotig 定理 设G是边染色的连通图且顶点的度为偶数,则当且仅当G是平衡图时,G存在一个交错的欧拉回路 平衡图:每个顶点都是平衡的图 Maxdc(v,E) ≤d(v,E)/2 则称顶点v是平衡的(dc(v,E)是与v关联的E的c色边的边数) * 二阶与三阶行列式的计算 * 作业 1、DNA片段大小是如何度量的? 2、若a=‖A‖={1
文档评论(0)