- 5
- 0
- 约1.31万字
- 约 19页
- 2018-06-26 发布于浙江
- 举报
DNA序列的k-mer_index问数模论文
重庆交通大学2015年第八届数学建模竞赛
参 赛 论 文
论 文 选 题 :B 题
学生姓名 学号 所在学院
联 系 电 话 : 1 E-mail地 址 :
DNA 序列的k-mer index问题
摘要
本小组在查阅了相关文献资料后,基于“数据结构”中的“哈希算法[2][6]”、“倒排索引[1][2]”法及“BKDRHash算法[2]”,建立相应的数学模型,给出分析和结果,对DNA 序列的k-mer index 问题给出解决方案。
本模型对不同k值采用不同算法建立索引。当k值较小时,利用基因序列其碱基种类较少(仅A,T,G,C四种)的特点,根据哈希算法进制转换的思想,可将k-mer 看成一个四进制的序列数,将其转化为十进制数作为哈希表的关键字[2],并采用倒排索引的方法对哈希表关键字分类整理,建立相应的地址存储单元,实现索引;当k值较大时,考虑到内存溢出[6]的问题,采用“BKDRHash算法”对k-mer进行十
原创力文档

文档评论(0)