- 1、本文档共90页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Fractal Characteristics of DNA Sequence Based on Chaos Game Representation
A Thesis Submitted to Chongqing University in Partial Fulfillment of the Requirement for the
Degree of Master of Engineering by
Xue Feng
Supervisor: Prof. Tian Fengchun
Major: Signal and Information Processing
College of Communication Engineering of Chongqing University, Chongqing, China April 2008
中文摘
中文摘要
重庆
重庆大学硕士学位论文
I
I
摘 要
随着生物信息学的发展和基因组数据的飞速积累,生命科学已步入后基因组 时代,基因功能的研究逐渐成为重点。分形是非线性领域的一门分支学科,关于 脱氧核糖核酸(DNA)序列分形特征的研究,可以揭示生物在进化过程中隐藏在 DNA 序列中的某些秘密。1990 年 Jeffrey 提出了基因组序列的与尺度无关的混沌游 戏表示法,这是基于迭代函数系统的一种方法,它将 DNA 序列中一定长度字的分 布规律表现为图形的分形特征,进而通过分形分析就可获取序列的分布规律,从 而也成为 DNA 序列分析的一种统计方法。
本文从 DNA 序列的混沌游戏图形表示法出发,结合分形理论,对 DNA 序列
的分形特征进行了较为全面的研究。主要结论如下:
首先,由 CGR 图形的频数矩阵,对 n ??长子序列的频数分布进行了分析,指 出长度大致相同的序列,其出现频数为 1 的 n ??长子序列个数随 n 的变化模式相当 一致;并探讨了 DNA 序列结构,指出 n ??长子序列的最高出现频数与 n 值之间的 关系以及出现频数为 1 的不同子序列的个数与 n 值之间的关系在不同物种中存在 一致性。
其次,讨论了 DNA 序列 CGR 图形的迭代函数系统,比较了不同序列在不同 收缩系数时的情况,得到了结论:收缩系数较大( k ??0.999 )时,相似的序列会 收缩为很小的一个相似图形,而随机选取的序列收缩后的小图形则差异较大。随 后,基于 CGR 图形对 DNA 序列进行了 R/S 分析,证实了 DNA 序列中存在长程相 关性。
然后,提出了一种计算 DNA 序列 CGR 图形的分形信息维数的方法,对序列 的编码区和非编码区的实验结果表明,对同一物种的编码区序列的信息维数比非 编码区序列的高。接着,以绝对差作为度量标准提出了一种计算 DNA 序列相似性 的方法,选取了不同特征的 3 组序列进行了比较,得到结论:不同物种的相同组 织的基因组序列、同一基因组的不同片段序列均具有较高的相似性。
最后,研究了 DNA 序列 CGR 图形的多重分形的计算过程,讨论了权重因子 及满足标度不变性的范围选择等问题,得到结论:对 CGR 图形进行多重分形时权 重因子可以选择为 ?15 ??q ??50 ;计算了不同序列的多重分形谱和广义维数,比较 了不同序列不同尺度的多重分形谱和广义维数,发现多重分形谱和广义维数能够 表现 DNA 序列 CGR 图形的不同层次的分形特征,能够区分更复杂的序列结构。
关键词:DNA 序列,混沌图形表示,分形特征,相似性分析,多重分形
英文摘
英文摘要
重庆
重庆大学硕士学位论文
III
III
IV
IV
ABSTRACT
With the development of bioinformatics and the rapid accumulation of genomics data, life science has entered the post-genome era, researches are gradually focused on the function of genes. Fractal is a subdiscipline of nonlinear area, researches on fractal characteristics of the deoxyribonucleic acid (DNA) sequence may reveal some secret hidden in the DNA sequence during the process of biological evolution. Chaos Game Representation (CGR) was proposed as a scale-indepen
您可能关注的文档
- 基于混沌算法的电力系统无功优化模型研究-电力系统及其自动化专业论文.docx
- 贾湖遗址墓葬腹土研究-科学技术史专业论文.docx
- 基于机器视觉的虚拟雕刻刀具跟踪及扫掠体建模研究-机械设计及理论专业论文.docx
- 贾家山1号隧道洞口仰坡失稳破坏及治理效果研究-岩土工程专业论文.docx
- 基于机器视觉的絮体检测与在线沉速测量研究与应用-计算机技术专业论文.docx
- 基于混沌算法的网络加密机设计与实现-通信与信息系统专业论文.docx
- 基于机器视觉的压力容器气密性检测系统设计-控制工程专业论文.docx
- 贾科梅蒂早期雕塑艺术-雕塑专业论文.docx
- 基于机器视觉的烟标在线检测系统的设计与实现-计算机应用技术专业论文.docx
- 基于混沌算法的信息安全系统的研究及其实现-控制理论与控制工程专业论文.docx
文档评论(0)