- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于蚁群算法双序列比对及其实现
基于蚁群算法双序列比对及其实现
序列比对是生物信息学的基础,本文首先分析了基于动态规划的经典双序列比对方法,然后根据蚁群算法求解旅行商问题的思路,将旅行商问题与双序列比对问题简单比较了它们的异同点,并详述了基于蚁群算法的双序列比对步骤,根据双序列比对过程的具体特点,对基本蚁群算法各个参量以及更新公式进行了相应的修改,成功实现了基于蚁群算法的双序列比对过程。
【关键词】蚁群算法 双序列比对 更新公式
序列比对是生物信息学的基础,通过在基因比对中获得大量的序列信息,可以推断基因的结构、功能和进化关系。生物序列比对主要应用在生物信息学上,例如DNA双序列比对其相似性能够反映出两条DNA亲缘关系,实现生物基因识别技术;通过研究病变的生物蛋白序列和正常的序列,能够有效地研究病变机理甚至采取一定的预防措施。在计算机领域,一般首先是将序列元素用不同的字符表示,一整条序列就可以用字符串来表示,因此,双序列比对问题就是比较两条字符串的相似性。
目前对于双序列比对方法主要是基于动态规划算法有经典的Needleman-Wunsch算法和Smith-Waterman算法,利用一定的打分规则和填充分值矩阵等步骤,可以进行序列的精确比对,主要包括比对和回溯两个过程,需要耗费大量的时间,对于较长序列,需要耗费大量存储空间来存储分值矩阵,因此,经典序列比对算法对机器性能有一定的要求。对于此种方法的不足,主要有两方面的改进与优化,一是算法上的优化,二是硬件上的优化。万文利用CUDA开发平台实现了基于CPU与GPU异构系统来加速Smith-Waterman算法,并且对算法进行了深入分析,设计CPU+GPU的协同并行方案,对应用程序性能与系统性能有显著的提升效果。夏飞利用FPGA器件结合通用处理器实现了算法加速器,并且设计了细粒度并行算法,成功解决了FPGA逻辑单元和存储资源在进行长序列比对时资源受限问题。
另一方面,已经衍生了很多优化算法做近似比对,比如遗传算法,模拟退火算法等现代智能算法,它们不能保证每次都能找到最优解,但是采用这些算法收敛速度快,效率高。本文详细分析了蚁群算法求解旅行商问题,并且与双序列比对问题做了具体的比较,得出它们的异同点,并将蚁群算法运用到求解双序列比对问题中。
1 经典比对算法及其实现
经典的Needleman-Wunsch算法和Smith-Waterman算法对于双序列比对分为两个过程:比对和回溯,比对结果可以得到两条序列的相似程度,回溯过程则可以得到序列中元素的配对结果,但回溯过程不是必须的。
1.1 双序列比对过程
假设对于给定的两条DNA序列,其中一条序列字符串表示为,另一条序列字符串表示为,两条序列中各元素sj和lj分别表示DNA四种碱基{A,G,C,T}。对于这两条序列的比对过程分三种编辑操作:替代、删除与插入,序列比对可以通过这三种编辑操作得到最大的相似性,即最优比对结果。
通常,为表示这个最优比对结果会采用一定的打分规则来表示比对过程的进行以及结果分析,设打分函数为:
如果序列元素sj与lj匹配相同,而且sj和lj都不是空位,则当前元素比对结果为+2分;如果sj与lj匹配不相同,而且sj和lj都不是空位,则比对结果为-1分,如果sj与lj其中一个为空位’-’,则比对结果为-2分。因此,通过对两条序列中的元素逐个比对,最终会得到一个总分值来表示双序列的匹配程度。经典的NW算法和SW算法就是利用打分规则和分值矩阵,填充完分值矩阵,然后是回溯过程,从分值右下角开始往上搜索局部最大分值最终可得到最优比对结果。
2 基于蚁群系统的双序列比对
2.1 问题比较与算法设计
蚁群算法是一种现代智能仿生算法,它通过模拟蚁群在觅食过程中寻找最短路径的方法来求解最优化问题,最早是应用在TSP问题上,取得了很好的效果,又来又与多种优化算法相结合,开始得到了?V泛应用。
用蚁群算法求解序列比对问题是在该领域的一种尝试,在利用蚁群算法求解TSP问题的基础上,将其算法思想用于求解序列比对问题上。双序列比对问题可以归结于:在分值矩阵中,求解出一条分值最大且路径最短的问题。如下,列出了利用蚁群算法求解旅行商问题和求解双序列比对问题上的主要异同点。
(1)在TSP问题中,蚂蚁的初始位置随机放置,而且在寻找下一个节点时也是随机选择,而在序列比对中,蚂蚁的初始位置位于分值矩阵的左上角,其搜索移动方向也只有三个:右边,下边和右下角;
(2)在TSP问题中,启发信息是城市间路径的长度,将每轮迭代中所有蚂蚁走的路径进行比较,选取其中一只蚂蚁行走的最短路径作为局部最优结果,而在序列比对中,将蚂蚁走的每一步所产生的字符匹配得分作为启发信息,当所有蚂蚁都走到分值矩阵的
您可能关注的文档
最近下载
- DB5111∕T 25-2022 嘉州菜 乐山甜皮鸭制作工艺规范.docx VIP
- 幼儿园保育技能基本功大赛试题及答案.doc VIP
- 混凝土结构课程设计-山西建筑职业技术学院精品课程.doc VIP
- 保育技能大赛答辩试题及答案.docx VIP
- 婴幼儿保育技能大赛试题附答案.doc VIP
- 华东交通大学211翻译硕士英语2020年考研真题试题.pdf VIP
- 华东交通大学211翻译硕士英语2019年考研真题试题.pdf VIP
- 2025年高级财务管理题库含参考答案.pdf VIP
- 中宁县大战场清真牛羊交易市场建设项目可行性研究报告.doc VIP
- 2025年10月自考行政管理学00277试题及解析.docx VIP
原创力文档


文档评论(0)