- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因序名列分析
南开大学数学院“学而思”杯数学建模比赛
编 号 专 用 页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
评
阅
人
评
分
备
注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
- PAGE 1 -
A 题:基因序列分析
摘要
本文通过对比HIV病毒基因序列,找出不同阶段的DNA基因序列的异同,进而分析基因位点的相关性,从而对比找出HIV病毒基因序列中较为重要的位点,为HIV病毒研究提供更多的研究方法与思路。
针对问题一:我们利用点矩阵分析及统计各碱基含量的百分比的方法,对比两文件中具有相同序列名的基因序列及具有不同序列名的基因序列,找出两者的异同,得出结论。两者的相似性表现在:同名序列具有子序列关系,不同名序列具有相当的相似性,各种碱基的含量具有稳定性。两者的不同点表现在:基因规模有很大差异,不同名序列出现了具有突变特点的基因序列差异。
针对问题二:我们首先利用DNAwalk法对HIV病毒基因序列位点进行分析,在分析的过程中发现由于基因和基因组序列中存在着高度的不均一性,即不同位置的碱基密度存在着很大的差异,因而DNAwalk法不太适合基因序列的分析,转而使用DFA模型对HIV基因的相关性进行分析和度量,得出了与DNAwalk模型相同的结论。
针对问题三:在前两问的分析基础上,结合前两问的分析结果及HIV病毒高度变异性的特点,我们得出重要的基因位点应满足下列条件:1、该基因位点位于Ⅱ基因序列,2、该基因位点所在序列的序列名应不同于Ⅰ中的序列名,3、该基因位点在问题二的分析中具有较高的相关性。
关键字:矩阵分析 DNAwalk DFA模型
问题重述
人类免疫缺陷病毒(Human Immunodeficiency Virus,HIV),简称艾滋病病毒,会造成人类免疫系统的缺陷, 导致艾滋病(AIDS). HIV基因组翻译成蛋白的过程相对复杂, 它会重复交叉使用某些基因片段。病毒序列在进化和传播的过程中主要是envelope基因变化很快。详细描述可见HIV的生活史。由于现有的抗艾滋病病毒药对HIV无法根治,因此就将“责任”归咎高变异性. 目前, 很多的HIV序列已经被测定出来, 附件给出了一些HIV的序列. 我们试图通过对HIV序列的分析来断定这些序列上哪些位置比较重要, 从而给艾滋病的研究一些帮助. 例如, 某些位置上的突变可能会影响到HIV的传播机制, 如果我们瞄准这些位置设计药物, 可能会对艾滋病的传播起到抑制作用.
HIV基因组序列大约长10k,HIV1_GENOME_DNA.fasta包含了1400余条基因组的序列, 因为在序列突变的过程中,有一些核酸会消失,这些消失的核酸在文件中使用”-“来表示。 表示此处发生了一次删除突变。也就是说, 文件中所有序列都是”对齐”的. 这样, 我们可以知道这些序列中某一个特定位点上核酸的分布情况. 另外,HIV基因组中包含了若干个编码蛋白质的基因,编码后的蛋白质可以行使病毒传播,致病等功能。HIV1_ENV_DNA.fasta是其中一个编码蛋白质基因的序列,HIV1_ENV_PRO.fasta是编码后的蛋白序列。它们同样是已经比对好的。 基于以上说明,我们来分析如下问题:
对于HIV1_ENV和HIV_GENOME的DNA序列,构造数学方法对序列的位点进行分析,指出这两者之间的异同。
HIV序列位点之间或者某些位点之间是否存在相关性?如果存在,那么如何去度量这种相关性?
对这些序列进行进一步的分析,找到你认为的HIV中较为重要的位点,并说明这些位点为什么重要。
知识背景
本文通过对HIV病毒的基因信息进行分析,从而得出HIV病毒基因中比较重要的位点,由于本问题专业性较强,所以我们将先对其中相关知识做出阐述:
名词解释:
基因组:Genome,生物所携带的遗传信息的总和,即单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。
基因位点:基因在染色体上占有的特定位置。
染色体:由脱氧核糖核苷酸、蛋白质和少量核糖核酸组成的线状或棒状物,是生物主要遗传物质的载体。因是细胞中可被碱性染料着色的物质而得名。
核糖体:结合着辅助蛋白质因子的多个核糖体RNA(rRNA)亚基组成的细胞器。
碱基:指嘌呤和嘧啶的衍生物,是核酸、核苷、核苷酸的成分。
一般细胞遗传信息传递相关原理
DNA转录成RNA,RNA再被翻译成蛋白质执行相应的功能。DNA碱基的序列决定了蛋白质的结构,但DNA并非直接翻译成蛋白质,基因组DNA先通过转录生成信使RNA(mRNA),单链的mRNA随后将离开细胞核,指导蛋白质的合成。这一过程称为翻译,由核糖体负责完成。构成蛋白质的20种氨基酸通过转运RNA(tRNA)的作用到达核糖体
您可能关注的文档
最近下载
- 渤海稠油油田聚合物驱高效开采技术.doc
- 重症患者的早期康复课件.pptx
- 中国南方电网公司招聘笔试题库2025.pdf
- 电气工程基础课程设计报告-110kV变电站电气系统初步设计.doc
- 化工常用阀门介绍.doc VIP
- 新仁爱科普2024版英语七年级上册Unit 1 Let's be friends大单元整体教学设计.docx
- 高考数学五年(2020-2024)真题《空间向量与立体几何(解答题)》分类汇编.docx
- 香港街头最不缺的就是美女,来自世界各地.pdf VIP
- 高考数学五年(2020-2024)真题《空间向量与立体几何》分类汇编.docx
- 2024年考务人员培训系统考试参考答案.docx VIP
文档评论(0)