- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学模型结课论文
数学模型结课论文
学院:
专业:
姓名:
学号:
针对14个病毒的RNA序列建树问题
摘要
RNA病毒的发现改变了人们对RNA的认识,它具有完成各种不同功能的能力。RNA既可以作为遗传物质被一代又一代的传下去,又可以像蛋白酶一样催化生物反应的进行。而蛋白质的组装器核糖体本身就是一个RNA与蛋白质形成的复合物。因此,对RNA的研究成为分子生物学界的研究热点,本文选取了14个病毒RNA二级结构,它们是:Halobacterium sp.,Pyrodictium occultum,Suifolobus sp.,Actinia equina,Planocera reticulata,Chrysaora quinquecirrba,Diatoma tenue,Christiansenia pallida,Basidiobolus magnus,Filobasidiella depauperata,Linderina macrospora,Hydrurus foetidus,Saprolegnia ferax,Pythium hydnosporum. Lempel-Ziv是一种序列压缩算法,常被广泛的应用于生物序列的进化树构建中。本文采用LZ算法的数学思想,选取关键字k,求出RNA序列的k字子串个数并与该RNA序列的碱基个数做商,从而生成频率向量。而在这里有14条RNA序列,可以生成一个距离矩阵并求出基于条件LZ复杂度的序列间距离,通过MATLAB软件刻画1这14个病毒的进化树,从而粗略的比较RNA二级结构。将本文做出的结果与经典结果进行对比,发现大体上一致,所以本文具有一定的可行性。
关键字:RNA序列 LZ算法 距离矩阵 进化树 MATLAB
问题重述
RNA分子功能多样化,它不仅携带遗传信息,还发现它具有进化信息。由于RNA二级结构比以及序列更具有保守性,从而选取14种病毒的RNA数据,它们的RNA链链长是120个碱基左右。这些RNA二级结构之间的差异很小,对应的RNA编码序列之间的差异也不大,从而试着采取数学方法来反映出它们的进化关系。
模型假设
所有采集数据均真实有效,不考虑数据在测量时产生的系统误差K S的字汇或k-字 S的子串 子串的频数 子串的频率 母串的长度或RNA碱基个数 频率向量 第条RNA序列的频率向量 RNA链个数 子串个数 距离矩阵中的元素 距离矩阵
问题分析
RNA二级结构由多种结构元素组成,其中假结结构是一种极其重要的结构,它能影响RNA分子的功能,当形成RNA二级结构的链很长的时候,链上的碱基配对情况一般很复杂,致使相应的RNA二级结构难于处理,尤其是包含假结的二级结构。在这部分我们把假结结构看作二级结构的特殊组成元素。我们希望使用某种表示方式,使得能够保留尽可能多的信息,构建进化树。构建进化树的方法主要有:距离法、最大简约法、最大似然法贝叶斯法等,本文采取距离法,依据一定的原则及算法构建系统发生树。主要思路是根据RNA序列,选取关键字,列出所有可能的序列对,计算序列之间的遗传距离,选出相似程度较大或非常相关的序列对,利用遗传距离预测进化关系。
模型的建立与求解
4.1模型的建立
在这里采用LZ算法,将一个RNA序列看成集合S,S可以根据k-字生成对应的子串:
其中k称为S的字汇或k-字。
再将每个子串在对应母串中出现的频数写成:
为了求出RNA序列的k字子串的频率,可以将对应频数与对应母串碱基个数做比:
从而生成频率向量:
T=[]
而在这里有14条RNA序列,可以生成14个频率向量:
通过求向量的最大特征值来确定距离矩阵的元素:
故有刻画向量之间关系的距离矩阵:
并求出基于条件LZ复杂度的序列间距离,从而刻画出进化树。
4.2模型的求解
根据算法,利用MATLAB程序可以进行求解(程序见附录),本文取1-字、2-字、3字,运行程序,结果分别见图1、图2、图3。
图1:1-字对应的进化树
图2:2-字对应的进化树
图3:3-字对应的进化树
根据以上进化树可以看出,随着k-字的增加,得到的结果渐趋于精确。本文选取3-字的进化树进行分析。图3中Halobacterium sp.,Pyrodictium occultum和Sulfolobus sp.被聚类在一起,并且他们明显和其它物种分开,这与它们同属于Archaebacteria的事实相符,从而可见此方法有一定的可行性;属于Stramenopiles的Saprolegnia ferax和Pythium hydnosporum被聚
您可能关注的文档
- 教师法习题.doc
- 教师朗读比赛方案评分表汇总表.doc
- 教师法制知识竞赛试题+完全版答案.doc
- 教师教育教学论文.doc
- 教师法治教育考试判断题专题.doc
- 教师练好基本功,课堂实效大提升.doc
- 教师考核民主测评表.doc
- 教师科研工作量定额及考核办法.doc
- 教师继续教育实践研修成果.doc
- 教师职业道德期末试卷C.doc
- DB32T3444 健康企业评估规范.pdf
- DBJ25-82-2000 甘肃省聚苯板外保温墙体设计与施工规程 甘肃省地方标准.pdf
- DB32T-核与辐射突发事件卫生应急处置技术规范 第3部分:现场流行病学调查及编制说明.pdf
- DB44T1430-2014 冷冻水产品流通冷链管理技术规范.pdf
- TCASME-监控系统安装与维护规范.pdf
- TCSAE-汽车远程升级(OTA)信息安全测试规范.pdf
- TJSSAE-智能网联汽车开放道路测试管理要求及编制说明.pdf
- TEERT-挥发性有机物污染治理设施工况自动监控技术规范.pdf
- TCASME-三跨连续节段梁悬浇施工技术规范.pdf
- DB36T-行政执法案卷评查规范编制说明.pdf
最近下载
- (完整版)初三化学方程式大全.pdf
- 卫健委临检中心 15项临床检验质量控制指标——解读与应用.pptx VIP
- GB/T 14165-2008_金属和合金 大气腐蚀试验 现场试验的一般要求.pdf
- NB∕T11502-2024光伏光热一体组件和空气源热泵联合热水系统通用技术条件.pdf
- 抖音粉丝群体数据分析报告.pptx
- 【国家标准】QBT 3826-1999 轻工产品金属镀层和化学处理层的耐腐蚀试验方法 中性盐雾试验(NSS)法.pdf
- 足部特效反射区疗法一览表 附足底穴位图.doc
- 按次收费合同5篇.docx VIP
- 棋类运动协会章程.docx
- 口腔科的2024年工作总结6篇.docx VIP
文档评论(0)