- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 1
毕 业 论 文(设 计)
论文(设计)题目:用智能化算法搜索DNA序列中的微信号
姓 名 _____
学 号 _________________
学 院 数学学院
专 业 信息与计算科学
年 级 2007级
指导教师
2011 年 5 月 29 日
目录
摘要……………………………………………………………………………………………1
关键词…………………………………………………………………………………………1
Abstract………………………………………………………………………………………2
Key words………………………………………………………………………………………2
导论………………………………………………………………………………………3
方法……………………………………………………………………………………5
(一)经典算法…………………………………………………………………………5
(1)模体驱动算法……………………………………………………………………5
(2)CONSENSUS算法………………………………………………………………………6
(3)吉布斯采样算法……………………………………………………………………10
(4)MEME算法……………………………………………………………………………11
(二)新型算法…………………………………………………………………………14
(1)WINNOWER算法……………………………………………………………………15
(2)SP-STAR算法……………………………………………………………………17
总结………………………………………………………………………………………………20
致谢………………………………………………………………………………………………21
参考文献…………………………………………………………………………………………22
附录………………………………………………………………………………………………24
原文………………………………………………………………………………………………24
相关译文…………………………………………………………………………………………27
PAGE 28
摘 要
微信号搜索问题一直是生物信息学中一个基础问题,目前存在着各种关于DNA微信号搜索的经典算法以及理论,但是目前的算法中仍然不存在一个理想的算法,能够在比较高的精度下锁定所要搜寻的模体。如果同时考虑算法的时间复杂度等因素的话,情况就变得更加不容乐观。
本文是针对DNA序列中微信号搜索问题中最典型的“挑战问题”,分别分析了经典的模体驱动算法、CONSENSUS 算法、吉布斯采样算法和 MEME 算法的原理,适用的条件以及它们的优缺点,重点用算法复杂度的相关理论分析了这几种经典算法的优点和局限性。
本文的重点内容是介绍两种基于组合最优化原理的新型算法——WINNOWER算法和SP-STAR算法。其中,着重用相当的篇幅介绍了winnowing原理,与其相对应的WINNOWER算法就是在此基础上,着重使用可扩展集合的概念,逐步缩小被搜索的目标存在的范围,但是如何从最终的集合中查找要得到的信号仍然是一个比较复杂的问题。而SP-STAR算法的亮点就是创造了一个新型的“距离”,与传统的算法中的距离概念在数值上的特性不同,SP-STAR算法中的成对评分函数能够更明显地区分信号模体和随机模体。
对于两种新算法,本文中也简单地涉及了一下它们的延伸情况,主要是初步研究在信号长度未知、存在间隙信号、样本被损坏、信号的核苷酸组成有偏差等情况下,我们如何来完成微信号搜索。
总之,与以前的经典算法相比,建立在组合学基础上的WONNOWER算法和SP-STAR算法是比较成功的搜索DNA微信号的算法,虽然目前仍然存在着一些局限性,这两种算法的高效性是显而易见的。
关键词:模体发现,组合最优化,性能评估
Abstract
Micro-signal-search has been a very fundamental problem in bioinformatics; there are various classic algorithms concerning how to search micro-signal in DNA sequences in the present, in which different theories have been put forward. However, none
您可能关注的文档
- 《应用环氧树脂涂层钢筋的成本效益分析》-毕业论文(设计).doc
- 《应用题教学策略之我见》-毕业论文(设计).doc
- 《应用题教学常见问题浅谈》-毕业论文(设计).doc
- 《应用题训练(二)》-毕业论文(设计).doc
- 《应用语言学理论研究》-毕业论文(设计).doc
- 《应用语言学论文关于幽默论文从关联理论看冷笑话的幽默》-毕业论文(设计).doc
- 《应用远程教育资源搞好农村语文教学》-毕业论文(设计).doc
- 《应用资料管理论文:在建设工程施工企业中应用资料管理软件的必要性》-毕业论文(设计).doc
- 《硬密封复合阀在珲春发电厂的应用》-毕业论文(设计).doc
- 《拥抱生活论文》-毕业论文(设计).doc
- 洋葱销售SOP流程及关键动作相关知识测试试卷.docx
- 深度解析《GBT 43841-2024内蒙古绒山羊》.pptx
- 电气设备运维及机械部件相关知识测试试卷.docx
- 深度解析《GBT 43843-2024网络协同制造平台数据服务要求》.pptx
- 思维倾向与开放性自我评估试卷.docx
- 危险化学品企业特殊作业安全相关知识考试试卷.docx
- 深度解析《GBT 43844-2024IPv6地址分配和编码规则 接口标识符》.pptx
- 智慧教学整体解决方案(1).doc
- 多重耐药菌感染防治知识及预防措施试卷.docx
- 深度解析《GBT 43845-2024基于扫描氮-空位探针的微弱静磁场成像测量方法》.pptx
最近下载
- 3.2测回法测水平角(教案)一《建筑工程测量》(高教版第2版).docx
- 2025年湖北省八市高三(3月)联考政治试卷(含答案详解).pdf
- 村级存在的问题清单报告.docx VIP
- 小学英语五年级下册阅读理解专题训练100篇含答案解析.docx
- 一年级统编道德与法治下册教案16.学先锋 做先锋(第1课时).pdf
- 中小学教育教学管理知识.docx VIP
- 精品解析:北京市北京师范大学附属实验中学2023-2024学年八年级下学期期中数学试题(解析版).docx VIP
- 12J9-1 室外工程(标准图集).pdf
- 七下5.1 人要自强(精美课件)2025学年七年级道德与法治下册.pptx VIP
- 旋挖灌注桩(12m长护筒)专项施工方案.pdf
文档评论(0)