基于C程序的DNA序列的k-mer_index数据查找.docVIP

  • 28
  • 0
  • 约1.05万字
  • 约 24页
  • 2018-01-23 发布于贵州
  • 举报

基于C程序的DNA序列的k-mer_index数据查找.doc

基于C程序的DNA序列的k-mer_index数据查找

论文题目: 姓名 学院 年级 专业 学号 联系电话 数学分析 高等代数 高等数学 线性代数 概率统计 数学实验 数学模型 CET4 CET6 2013 级 电气工程及其自动化 \ \ 91 89 96 \ \ 560 \ 电气工程学院 2013 级 电气工程及其自动化 \ \ 91 88 85 \ \ 578 540 电气工程学院 2013 级 电气工程及其自动化 \ \ 85 89 89 \ \ 554 \ 基于C程序的DNA序列的k-mer index数据查找 摘要 DNA 是生命体的基本遗传物质,其组成和序列变化创造了形形色色的生命世界。快速、准确地获取生物体的遗传信息对于生命科学的研究具有重要意义[1]。现需要给定一种数据索引方法 ,利用一种查询算法查询百万条序列中是否存在相应的片段,如果存在,则输出相应片段所在的位置。 针对问题一,运用karp-Rabin算法,在C程序环境下编写字符串匹配算法。具体做法是将碱基序列映射成四进制的数串,对给定的k,构造合适的哈希函数,将四进制数串内每个长度为k的子数串译为唯一的十进制数,按顺序放进索引数组(哈希表)。查找相同的字符串等价于判断相应的hash值是否相同。此法可以大大提高建立索引和查询的时间。 针对问题二,对不同k值经过大量多次的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档