南开建模论文基因题.doc

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2012年南开大学数学建模竞赛论文 A题: 分 析 组长:付丽娜 队员:黄茉菊、朱保军 指导老师:刘彦 参赛单位:天津师范大学数学科学学院 摘要 本文根据给定的HIV病毒DNA序列,对具建立数学模型,分析具碱基的分布 及其相关性,并结合生物学背景,找到DM序列中重要的位点,从而为艾滋病的 研究提供帮助。 首先,利用选定的DNA片段,运用Mat lab软件编程对这些位点进行对比, 分析对应碱基位点的异同情况,我们从结论中可以看岀,这些DNA片段的位点Z 间存在某些相关性。 其次,结合上面的分析,运用Mat lab软件画图,若存在连续的点,那么这 些位点Z间就存在相关性,且连续点的个数是度量相关性的标准,即连续的点越 多,越相关。 最后,运用VC++取HIV1_ENV的DNA序列前900个,将这些基因翻译成300 个氨基酸,然后与HIV1_ENV_PRO中的蛋白序列进行对比,由此得到重耍的位点。 关键词:HIV基因,DNA序列,Mat lab,氨基酸 问题的重述 艾滋病在全球的广泛流行已给人类带来了严重的危害,且尚无有效的疫苗和 药?物进行预防和治疗,因此控制艾滋病的流行仍是全球齐国而临的重大公共卫生 问题,对艾滋病的根治也是医学界的重大难题。现有一些HIV序列,我们试图运 用数学建模的思想通过对IIIV序列的分析來断定这些序列上哪些位豊比较重要, 并解决下面的问题,从而给艾滋病的研究一些帮助。 1. 1对于HIV1_ENV和HIV GENOME中的DNA序列,构造数学方法对序的位 点进行分析,指岀这两者Z间的异同。 1. 2研究H1V序列位点Z间或者某些位点Z间是否存在相;若存在,请度量 这种相关性。 1.3找到H1V+较为重耍的位点,并说明原因。 二、符号说明 A:由1替代 C:由2替代 G:由3替代 T:由4替代 A:矩阵A B:矩阵B 三、模型假设 3. 1 DNA是双链的,在该模型中假设我们都是以DNA的同一边来进行 分析研究。 HJLV基因组翻译成蛋白的过程相对复杂,它会重复交叉使用某些 基因片段,在该模型中假设DNA是按照顺序来翻译的。 DNA序列有多个DNA片段,我们假设只选取其中前1000个DNA 片段来进行建模。 3.4在基因转录和翻译过程中,不发生基因变异和重组。 3. 5在解决第三个问题时,假设我们以HJLV GENOME屮的900个碱基, 即300个氨基酸为例。 问题的分析 问题一的分析,分别选取H1V1 ENV和HIV GENOME中的1000个DNA序列, 将碱基A、C、G、T分别由1、2、3、4代替,并将”删除。运用Mat lab软件 编程对这些位点进行对比,分析对应碱基位点的异同情况。原理是设IIIV1_ENV 的DNA序列为矩阵A, HIV_GENOME的DNA序列为矩阵B,其中矩阵A、B都为一 维行列式,在矩阵C里。将A、B对应位置相同的点赋值为5 (常理应赋值为1, 但因为1、2、3、4湖),A、B对应位置不相同的点赋值为0,运用Mat lab软 件编程出对应位置相同的点下标,看连续的点越多,HIV1_ENV和HIV_GENOME的 DNA序列这两者Z间的异同就很明显。 问题二的分析,在问题一的条件下,取IIIV1_ENV和IIIV_GENOME的DNA序列 的前200个碱基。将A、B对应位置相同的点赋居为5, A、B对应位置不相同的 点赋值为0,运用Mat lab软件画图,连续的点越多,那么越相关,且连续点的 个数是度量相关性的标准,即连续的点越多,越相关。 问题三的分析,运用VC++来建模,取HIV1_ENV的DNA序列前900个,将这 基因翻译300个氨基酸,翻译后的300个氨基嗽与已知的前300个氨基酸对比, 设翻译后的300个氨基酸的矩阵为A,己知的前300个氨基酸为其屮矩阵A、 13都为一维行列式,在矩阵C里,将A、13对应位置相同的点赋值为5, A、13对 丿应位置不相同的点赋值为0,运用Matlab软件编程出对应位置相同的点下标, 连续的点越多,就是重耍的位点。我们可以将那些具有相同氨基酸对应的位点看 做比较重要的位点,并进一步深入的研究这些位点,从而达到模型的更优化。 五、建模前的准备 5. 1将碱基A、C、G、T分别由1、2、3、4代替 5.2将删除 5.3三个密码子决定一个氨基酸,起对应表为 TTT 二 F TTC=F TTA=L TTG=L TCT=S TCC=S TCA 二 S TCG=S TAT 二 Y TAC=Y TAA二end TAG二 end TGT=C TGC=C TGA=end TGG=W CTT=L CTC=L CTA=L CTG 二L CCT=P CCC=P CCA 二P CCG=P CAT=H CAC=H CAA=Q CAG=Q CGT=R CGC

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档