- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕 业 设计
( 2012 届)
题 目 DNA数值化映射方法
的研究
学 院 物理电气信息学院
专 业 电子信息工程工程
年 级 2008级
学生学号 12008243846
学生姓名 李崎
指导教师 马玉韬
2011年11月28日毕业设计开题报告
论文题目 DNA序列数值化映射方法的研究和PN法,但至今为止编码区的预测准确率仍然不能达到像原核生物那样高的准确率,所以新的映射方法仍是研究的一个重要内容。至今为止研究者依旧在寻找新的映射方法来对真核生物的外显子进行预测,并提高预测的准确率。 参考文献
[1] Sitanshu S S, Ganapati P. “Identification of protein-coding regions in DNA sequences using a time-frequency filtering approach [J].” Genomics, Proteomics Bioinformatics, 2011, 9: 45-55.
[2] B D Silverman and R Linsker. “A measure of DNA periodicity [J].” Journal of Theoretical Biology, 1986, 118: 295-300.
[3] 胡广书. 数字信号处理:理论算法与实现(第二版)[M], 北京:清华大学出版社,2003: 296-312.
[4] 马宝山,朱义胜. 一种用于基因预测的FIR数字滤波器[J]. 电子学报. 2007,35(9):1710~1713. 和PN法,但至今为止编码区的预测准确率仍然不能达到像原核生物那样高的准确率,所以新的映射方法仍是研究的一个重要内容。
至今为止研究者依旧在寻找新的映射方法来对真核生物的外显子进行预测,并提高预测的准确率。
二 毕业设计方案及介绍
2.1 毕业设计方案
2.2 DNA序列的几种映射方法
2.2.1 Voss法
Voss法是应用最为广泛且较早提出的一种将DNA序列映射为二进制数字序列的DNA序列数值化表示方法。这种方法将一个长度为 的DNA序列表示为四个长度为 的二进制数字序列 。在这四个数字序列中,以为例,分别用1和0表示碱基在序列中时刻的出现和缺失。(1)式给出了一个长度N=12碱基序列及其Voss法映射得到的四个数值序列。
.
这种表示方法的主要优点是不会引入相关;可以证明任何维数小于4的表示方法其本身就会引入相关。
2.2.2 Z曲线法
曲线(三维)法是天津大学的张春霆院士于1994年提出。曲线法是将DNA序列转换成与其等价的三维表达式。这种方法先将DNA序列用Voss法映射为四个二进制数字序列和,然后利用关系式:
将之转换为公式
这实际上是三个由+1和-1构成的数值序列。
2.2.3 正四面体法
Tetrahedron法将DNA序列中的每一个碱基映射为三维向量空间中正四面体的一个顶点(公式(4)),各点在三维空间的坐标用三基色r、g和b表示后,可以统一为公式(5)。公式(5)中和为由Voss法映射得到的四个数值序列。这就是说正四面体法将一个DNA序列映射为3个实数序列。
,
.
2.2.4 复数法
复数表示法有两种,一种(Complex1)是将DNA序列按照,,和实现数值映射,其依据是双螺旋DNA结构中表现出的配对和配对互补原则。这种表示法能够从复数的数学性质方面展示核酸的一些互补特征。另外一种(Complex2)是将DNA序列按照,,和实现数值映射,这种映射方法将嘌呤(或)落在实轴上而将嘧啶(或)落在虚轴上。
2.2.5 EIIP法
EIIP映射方法是将电子-离子作用势赋予四种碱基,即令,,和,从而得到一个或四个实数序列。
2.2.6实数法
实数映射法有几种不同的表示。RN1(Real Numbers 1)是令,,,和[10];RN2(Real Numbers 2)是令,,和;这两种前者是使得嘌呤(或)大于嘧啶(或),后者是使得嘌呤小于嘧啶。RN3(Real Numbers 3)是令,,,和,这种方法在一定的意义上满足碱基互补性。这种方法的缺点是不能充分反映原始DNA序列所表示
文档评论(0)