- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2012年南开大学数学建模竞赛论文
A题:
分析
组长:付丽娜
队员:黄茉菊、朱保军
指导老师:刘彦
参赛单位:天津师范大学数学科学学院
摘要
本文根据给定的HIV病毒DNA序列,对具建立数学模型,分析具碱基的分布 及其相关性,并结合生物学背景,找到DM序列中重要的位点,从而为艾滋病的 研究提供帮助。
首先,利用选定的DNA片段,运用Mat lab软件编程对这些位点进行对比, 分析对应碱基位点的异同情况,我们从结论中可以看岀,这些DNA片段的位点Z 间存在某些相关性。
其次,结合上面的分析,运用Mat lab软件画图,若存在连续的点,那么这 些位点Z间就存在相关性,且连续点的个数是度量相关性的标准,即连续的点越 多,越相关。
最后,运用VC++取HIV1_ENV的DNA序列前900个,将这些基因翻译成300 个氨基酸,然后与HIV1_ENV_PRO中的蛋白序列进行对比,由此得到重耍的位点。
关键词:HIV基因,DNA序列,Mat lab,氨基酸
问题的重述
艾滋病在全球的广泛流行已给人类带来了严重的危害,且尚无有效的疫苗和 药?物进行预防和治疗,因此控制艾滋病的流行仍是全球齐国而临的重大公共卫生 问题,对艾滋病的根治也是医学界的重大难题。现有一些HIV序列,我们试图运 用数学建模的思想通过对IIIV序列的分析來断定这些序列上哪些位豊比较重要, 并解决下面的问题,从而给艾滋病的研究一些帮助。
1. 1对于HIV1_ENV和HIV GENOME中的DNA序列,构造数学方法对序的位 点进行分析,指岀这两者Z间的异同。
1. 2研究H1V序列位点Z间或者某些位点Z间是否存在相;若存在,请度量 这种相关性。
1.3找到H1V+较为重耍的位点,并说明原因。
二、符号说明
A:由1替代
C:由2替代
G:由3替代
T:由4替代
A:矩阵A
B:矩阵B
三、模型假设
3. 1 DNA是双链的,在该模型中假设我们都是以DNA的同一边来进行 分析研究。
HJLV基因组翻译成蛋白的过程相对复杂,它会重复交叉使用某些 基因片段,在该模型中假设DNA是按照顺序来翻译的。
DNA序列有多个DNA片段,我们假设只选取其中前1000个DNA 片段来进行建模。
3.4在基因转录和翻译过程中,不发生基因变异和重组。
3. 5在解决第三个问题时,假设我们以HJLV GENOME屮的900个碱基, 即300个氨基酸为例。
问题的分析
问题一的分析,分别选取H1V1 ENV和HIV GENOME中的1000个DNA序列, 将碱基A、C、G、T分别由1、2、3、4代替,并将”删除。运用Mat lab软件 编程对这些位点进行对比,分析对应碱基位点的异同情况。原理是设IIIV1_ENV 的DNA序列为矩阵A, HIV_GENOME的DNA序列为矩阵B,其中矩阵A、B都为一 维行列式,在矩阵C里。将A、B对应位置相同的点赋值为5 (常理应赋值为1, 但因为1、2、3、4湖),A、B对应位置不相同的点赋值为0,运用Mat lab软 件编程出对应位置相同的点下标,看连续的点越多,HIV1_ENV和HIV_GENOME的 DNA序列这两者Z间的异同就很明显。
问题二的分析,在问题一的条件下,取IIIV1_ENV和IIIV_GENOME的DNA序列 的前200个碱基。将A、B对应位置相同的点赋居为5, A、B对应位置不相同的 点赋值为0,运用Mat lab软件画图,连续的点越多,那么越相关,且连续点的 个数是度量相关性的标准,即连续的点越多,越相关。
问题三的分析,运用VC++来建模,取HIV1_ENV的DNA序列前900个,将这 基因翻译300个氨基酸,翻译后的300个氨基嗽与已知的前300个氨基酸对比, 设翻译后的300个氨基酸的矩阵为A,己知的前300个氨基酸为其屮矩阵A、 13都为一维行列式,在矩阵C里,将A、13对应位置相同的点赋值为5, A、13对 丿应位置不相同的点赋值为0,运用Matlab软件编程出对应位置相同的点下标, 连续的点越多,就是重耍的位点。我们可以将那些具有相同氨基酸对应的位点看 做比较重要的位点,并进一步深入的研究这些位点,从而达到模型的更优化。
五、建模前的准备
5. 1将碱基A、C、G、T分别由1、2、3、4代替
5.2将删除
5.3三个密码子决定一个氨基酸,起对应表为
TTT 二 F
TTC=F
TTA=L
TTG=L
TCT=S
TCC=S
TCA 二 S
TCG=S
TAT 二 Y
TAC=Y
TAA二end TAG二 end
TGT=C
TGC=C
TGA=end
TGG=W
CTT=L
CTC=L
CTA=L
CTG 二L
CCT=P
CCC=P
CCA 二P
CCG=P
CAT=H
CAC=H
CAA=Q
CAG=Q
CGT=R
CGC
您可能关注的文档
- 南疆红枣产业发展分析毕业论文.doc
- 南疆团场棉花生产发展及建议.doc
- 南郊安全施工方案.doc
- 南京财经大学毕业论文.docx
- 南京财经大学分析.doc
- 南京大学法学研究生招生.doc
- 南京大学物化论文金胶体的制备.doc
- 南京大学与墨尔本大学联合培养全日制建筑学专业硕士双学位.doc
- 南京丁家庄物流园区项目立项申报建议书.docx
- 南京对外经济特征及发展建议.doc
- 四川省德阳市罗江中学2025届高三考前热身化学试卷含解析.doc
- 山东省枣庄现代实验学校2025届高三下学期第五次调研考试化学试题含解析.doc
- 吉林省长春市十一高中等九校教育联盟2025届高三一诊考试生物试卷含解析.doc
- 2025届江苏省盐城市伍佑中学高考仿真模拟化学试卷含解析.doc
- 2025届广西贺州中学高考冲刺押题(最后一卷)生物试卷含解析.doc
- 安徽省池州市贵池区2025届高三第一次模拟考试生物试卷含解析.doc
- 宁夏银川一中2025届高三(最后冲刺)化学试卷含解析.doc
- 广东省广州市增城区四校联考2025届高考压轴卷化学试卷含解析.doc
- 2025届邯郸市第一中学高考生物必刷试卷含解析.doc
- 2025届安徽省安庆市石化第一中学高考仿真卷化学试卷含解析.doc
文档评论(0)