- 28
- 0
- 约1.05万字
- 约 24页
- 2018-01-23 发布于贵州
- 举报
基于C程序的DNA序列的k-mer_index数据查找
论文题目:
姓名 学院 年级 专业 学号 联系电话 数学分析 高等代数 高等数学 线性代数 概率统计 数学实验 数学模型 CET4 CET6
2013 级 电气工程及其自动化
\ \ 91 89 96 \ \ 560 \
电气工程学院
2013 级 电气工程及其自动化
\ \ 91 88 85 \ \ 578 540
电气工程学院
2013 级 电气工程及其自动化
\ \ 85 89 89 \ \ 554 \
基于C程序的DNA序列的k-mer index数据查找
摘要
DNA 是生命体的基本遗传物质,其组成和序列变化创造了形形色色的生命世界。快速、准确地获取生物体的遗传信息对于生命科学的研究具有重要意义[1]。现需要给定一种数据索引方法 ,利用一种查询算法查询百万条序列中是否存在相应的片段,如果存在,则输出相应片段所在的位置。
针对问题一,运用karp-Rabin算法,在C程序环境下编写字符串匹配算法。具体做法是将碱基序列映射成四进制的数串,对给定的k,构造合适的哈希函数,将四进制数串内每个长度为k的子数串译为唯一的十进制数,按顺序放进索引数组(哈希表)。查找相同的字符串等价于判断相应的hash值是否相同。此法可以大大提高建立索引和查询的时间。
针对问题二,对不同k值经过大量多次的
您可能关注的文档
- 基于BIOS的嵌入式系统数据通讯开发.doc
- 基于AVR和SG3525的数控开关电源设计.doc
- 基于ATS89C52单片机的多功能智能小车设计.doc
- 基于BS模型的个人住房贷款系统设计与实现.doc
- 基于BS架构的火车站自助服务系统.doc
- 基于BS模式的网上调查系统的设计和实现.doc
- 基于BS模式的网上购物系统的研究与开发.doc
- 基于BS的教学信息管理系统.doc
- 基于BS的大学网上教学系统的设计与实现.doc
- 基于BS结构的水电费网上查询系统开发和设计.doc
- 6.1 亚洲的自然环境特征教学设计( 第2课时)地理七年级下学期商务星球版(2024).docx
- Unit 3 Getting along with others(教学设计)英语译林版2020必修第一册.docx
- Unit 3 Getting along with others Period 3(教学设计)英语译林版2020必修第一册.docx
- Unit 3 Getting along with others Period 4(教学设计)高中英语译林版2020必修第一册.docx
- Unit 5Humans and Nature Period 3(教学设计)高中英语北师大版2019必修第二册.docx
- 第一节 能量的转化与守恒(讲义)物理沪科版2024九年级全一册.docx
- 第19讲 机械能守恒定律及其应用(复习讲义)高考物理一轮复习.docx
- 第11讲 氧化还原反应的应用-氯气制备 新高一化学讲义(鲁科版2019).docx
- 第一章 运动的描述(复习讲义)高中物理人教版2019必修第一册.docx
- 2.1 烷烃-高二化学(人教版2019选择性必修3).docx
原创力文档

文档评论(0)