基于C程序的DNA序列的k-mer_index数据查找.docVIP

下载本文档

28
0
约1.05万字
约 24页
2018-01-23 发布于贵州
举报

基于C程序的DNA序列的k-mer_index数据查找.doc

基于C程序的DNA序列的k-mer_index数据查找

论文题目：姓名学院年级专业学号联系电话数学分析高等代数高等数学线性代数概率统计数学实验数学模型 CET4 CET6 2013 级电气工程及其自动化 \ \ 91 89 96 \ \ 560 \ 电气工程学院 2013 级电气工程及其自动化 \ \ 91 88 85 \ \ 578 540 电气工程学院 2013 级电气工程及其自动化 \ \ 85 89 89 \ \ 554 \ 基于C程序的DNA序列的k-mer index数据查找摘要 DNA 是生命体的基本遗传物质，其组成和序列变化创造了形形色色的生命世界。快速、准确地获取生物体的遗传信息对于生命科学的研究具有重要意义[1]。现需要给定一种数据索引方法，利用一种查询算法查询百万条序列中是否存在相应的片段，如果存在，则输出相应片段所在的位置。针对问题一，运用karp-Rabin算法，在C程序环境下编写字符串匹配算法。具体做法是将碱基序列映射成四进制的数串，对给定的k，构造合适的哈希函数，将四进制数串内每个长度为k的子数串译为唯一的十进制数，按顺序放进索引数组（哈希表）。查找相同的字符串等价于判断相应的hash值是否相同。此法可以大大提高建立索引和查询的时间。针对问题二，对不同k值经过大量多次的

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于C程序的DNA序列的k-mer_index数据查找.docVIP