DNA限制性图谱的绘制(数学建模论文)教案.doc

DNA限制性图谱的绘制(数学建模论文)教案.doc

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DNA限制性图谱的绘制(数学建模论文)教案

DNA限制性图谱的绘制 摘要 本文是关于用SPDP法(即简化的部分消化方法)来确定DNA链的基本的片段排列顺序的问题。 针对问题一,我们运用穷举法,并根据实际DNA链的排列实际将穷举法进行限定,即用简化穷举法。并以此为基础建立二叉树数据结构模型,通过MATLAB软件计算,对问题一中的两个实例进行求解。由于实例一,由于所给数据量非常小,我们可以通过笔算进行试值的办法或者通过MATLAB程序得出其排列顺序为2-6-1-4-3。对于实例二,由于存在可能解一共有八组,我们不再在这里表示出来。 SPDP算法是基于二叉树数据结构的穷举法产生的,首先经过了标准化的过程,然后利用?b-b表与b-c表两个表逻辑、拓扑的关系相互约束,以此对穷举法进行限定,使穷举的次数大大降低,达到实用的效果。但是当所给实验数据较多是任然相当费时费力,而且SPDP所得出的结果也不唯一,所给实验数据越多则实验所得可能的X也越多,还需要根据实际遗传学DNA序列的规律进行排除,选择最终唯一正确的值。所以该方法在实验数据大时实用性较低。 针对问题二,随着实验数据的增多不能分辨的元素也越来越多,使得可能的X也增多。 X的增多意味着任然需要很大的后续工作量。在误差存在的条件下,一组数据的相互分辨能力决定于两个因素,一是误差限的大小,二是数据值分布的疏密程度,即数据的方差(或标准差)。所以,当数据的平均绝对误差限的数量级达到与数据标准差相当的或更大程度时,数据之间的分辨就会变得非常困难,问题的求解也会变得基本无法进行了。 在模型建立后,我们对其进行了推广及应用,并取得了积极有效的成果。 一、问题重述 绘制DNA限制性图谱(restriction mapping)是遗传生物学中的重要问题。由于DNA分子很长,目前的实验技术无法对其进行直接测量,所以生物学家们需要把DNA分子切开,一段一段的来测量。在切开的过程中,DNA片段在原先DNA分子上的排列顺序丢失了,如何找回这些片段的排列顺序是一个关键问题。 为了构造一张限制性图谱,生物学家用不同的生化技术获得关于图谱的间接的信息,然后采用组合方法用这些数据重构图谱。一种方法是用限制性酶(restriction enzyme)来消化DNA分子。这些酶在限制性位点(restriction sites)把DNA链切开,每种酶对应的限制性位点不一样。对于每一种酶,每个DNA分子可能有多个限制性位点,此时可以按照需要来选择切开某几个位点(不一定连续)。DNA分子被切开后,得到的每个片段的长度就是重构这些片段的原始顺序的基本信息。在多种获取这种信息的实验方法中,有一种广泛采用的方法:部分消化(the partial digest, PDP)方法。 在PDP中,采用一种酶,通过实验得到任意两个限制性位点之间片段的长度。假设与使用的酶对应的限制性位点有n个, 通过大量实验,可得到n+2个点(n个位点加上两个端点)中任意两点之间的距离,共个值。然后用这个距离来重构n个限制性位点的位置(解不一定唯一,两个端点对应于最长的距离)。若是线段上的点集中所有点之间距离的集合,PDP就是给定求。下图给出了一个例子。 图1. A,B是DNA分子的两个端点。 a,b,c和d是限制性位点。 通过实验可以得到 ={2,3,4,5,2,5,9,14,16,7,12,14,9,11,7}. 再通过来求,对应于上图的={0,2,5,9,14,16}是一种解。 上述方法要把DNA分子在任意的两个限制性位点处切开,这对于当前的实验技术来说有相当难度,而且,还要对实验数据进行处理,也很复杂。最近研究人员提出了一种新的方法,称为简化的部分消化方法(SPDP)。这个方法与PDP的不同就在于它避免了在任意两个位点切开DNA分子的难题和处理重复数据的困难。仍假设与使用的酶对应的限制性位点有n个。首先DNA分子被复制成n+1份,前n个复制品中的每一个在一个限制性位点处被切开,最后一个复制品在所有的限制性位点处被切开。这样我们分别得到2n个片段长度(称为第一组数据)和n+1个片段长度(称为第二组数据)。在没有误差的前提下,第一组数据中2n个长度可以分成n对,每对的和都等于DNA分子的总长度;第二组数据中n+1个长度的和也等于DNA分子的总长度。 SPDP问题是如何利用这两组数据重构出这n+1个片段在DNA分子上的排列,使得这个排列在n个位点切开后得到的2n个片段长度与实验得到的2n个长度相等。下图给出了一个例子。 图2. 这个例子对应的位点有4个。(a) 就是我们希望重构的顺序。 (b)中的前4对为第一组数据,它通过切开

您可能关注的文档

文档评论(0)

rovend + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档