- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
后缀树论文:生物序列索引结构构造算法研究.doc
后缀树论文:生物序列索引结构构造算法研究
【中文摘要】生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。如何快速而有效地对生物数据进行处理,从而发现蕴涵于其中的丰富生物知识,是生物信息学研究的重要内容。其中,生物序列的索引技术是目前的一个研究热点。本文主要是对生物序列的索引结构进行研究,重点研究了索引结构的构造算法。首先介绍了索引技术的发展现状,阐述了后缀树和后缀数组索引结构的定义以及相关概念,总结了国内外现有的索引结构构造算法。然后着重介绍并分析了基于后缀数组和后缀树等数据结构的索引结构构造算法。对于较小的序列来说,后缀树索引是一种很好的解决办法,但由于存在“内存瓶颈”问题,不适合大的序列;而后缀数组则需较少的存储空间,但在数据搜索方面的效率却较低。由此,本文基于自顶向下的后缀树构造思想,提出了一种基于后缀树的索引结构分步构造算法。首先对所有后缀按照字母表顺序进行排序,再求出有序相邻后缀之间的最长公共前缀,最后根据后缀顺序和最长公共前缀构造后缀树。该算法不但可以在线性时间内构造后缀树,而且不需要使用后缀链,在一定程度上缓解了“内存瓶颈”问题。
【英文摘要】Bioinformatics is the science of using computer technology to store, retrieve and analyze biological information in the field of life sciences. To develop rapid and effective computer algorithm to find knowledge from very large biological data is the main research work.This thesis mainly focuses on the study of suffix tree and suffix array index technical dealing with bio-sequences. First, index structure of bio-sequences is described, then several algorithms of indes structure construction based on the...
【关键词】后缀树 后缀排序 后缀数组 最长公共前缀 自顶向下
【英文关键词】suffix tree suffix sorting suffix array longest common prefix top-down
【目录】生物序列索引结构构造算法研究
摘要
3-4
Abstract
4
第一章 绪论
7-11
1.1 研究背景
7-8
1.1.1 研究动机与意义
7-8
1.1.2 生物序列上的索引技术
8
1.2 本文研究工作
8-9
1.3 本文组织结构
9-11
第二章 生物序列索引结构概述
11-23
2.1 后缀树索引结构
11-13
2.2 后缀数组索引结构
13-14
2.3 其他索引结构
14-15
2.4 后缀树与后缀数组比较
15
2.5 索引结构的存储
15-17
2.5.1 直接存储方式
15-16
2.5.2 优化储存方式
16-17
2.6 生物序列的搜索技术
17-18
2.6.1 精确字符串匹配
17
2.6.2 近似字符串匹配
17-18
2.7 索引结构的应用
18-21
2.7.1 基于后缀树的多序列比对算法
18-19
2.7.2 QUASAR算法
19-21
2.8 本章小结
21-23
第三章 常见的索引结构构造算法
23-35
3.1 基于后缀数组的索引结构构造算法
23-28
3.2 基于后缀树的索引结构构造算法
28-32
3.2.1 后缀树相关术语
28
3.2.2 Ukkonen后缀树构造
28-31
3.2.3 自顶向下的后缀树构造算法
31-32
3.3 本章小结
32-35
第四章 分步的后缀树索引结构构造算法
35-43
4.1 对文本中的所有后缀进行排序
35-38
4.2 求相邻后缀之间的最长公共前缀
38-39
4.3 构造后缀树
39-40
4.4 算法分析及实验结果
40-41
4.5 本章小结
41-43
第五章 总结与展望
43-45
致谢
45-47
参考文献
47-51
研究成果
51
您可能关注的文档
最近下载
- 17J008 挡土墙(重力式、衡重式、悬臂式)(最新).pdf VIP
- 雨污分流改造工程施工组织设计方案.pdf VIP
- 第九版儿科学配套课件-6.2-正常足月儿和早产儿的特点与护理.ppt VIP
- T_CACM 1601-2024 笑病中医诊疗指南.docx VIP
- 矿山三级(二级)矿量管理办法.doc VIP
- T_CACM 1583-2024 百合病中医诊疗指南.pdf VIP
- 趣味生物知识竞赛100选择题附答案.pdf VIP
- T_CACM 1584-2024 卑惵中医诊疗指南.pdf VIP
- 2025年第二批陕西延长石油集团所属单位内部遴选及选聘81人笔试参考题库附带答案详解.docx
- T_CACM 1585-2024 产后神志异常中医诊疗指南.pdf VIP
文档评论(0)