三代测序条形码识别算法的硬件实现.pdfVIP

三代测序条形码识别算法的硬件实现.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

随着第三代脱氧核糖核酸(DNA)测序技术的测序通量不断提高,利用“DNA

测序条形码(Barcode)”实现多个样本并行测序成为有效利用三代测序设备测序

能力的重要策略。考虑到测序过程中存在复杂的测序错误,尤其是插入与删节错

误,研究者借助通信系统中的纠错码(例如Levenshtein码),提出了很多不同容

量与“鲁棒性”的DNA条形码构造与解码方法。然而,由于新一代测序技术的

序列数据吞吐量很大,并且DNA测序条形码识别的复杂度往往较高,通用计算

机难以满足高通量的测序数据的处理需求。针对这一问题,论文研究了一种高鲁

棒性的测序条形码识别算法的硬件实现,完成了高吞吐率、低硬件复杂度的测序

条形码识别算法加速器。

针对基于循环移位和动态规划的高鲁棒性测序条形码识别算法,设计并实现

了基于现场可编程门阵列(FieldProgrammableGateArray,FPGA)的算法实现。

具体地,首先分析了条形码识别算法的基本原理与方法,并按照自顶向下的设计

方法对硬件加速电路进行模块划分,依据FPGA的并行特点和识别算法的功能要

求对各个模块提出优化设计。设计中,针对动态规划算法的复杂度高的问题,提

出通过优化迭代方程映射为处理单元时的电路结构,以提高处理单元(Process

Element,PE)映射效率的脉动式阵列结构,并设计了基于回溯算法纠正插入/删

节错误的电路架构。

进一步,基于FPGA平台对测序条形码识别加速电路进行综合仿真和硬件实

际测试验证。具体地,首先给出了硬件加速器以及内部关键模块在FPGA上搭建

实现后的时序仿真波形图,通过仿真结果验证硬件加速器内部各模块时序和功能

正确。其次,分析了硬件加速器的逻辑资源占用情况。最后,在FPGA工作频率

为100MHz的情况下,验证了针对不同长度的测序条形码构建的识别加速器的

硬件加速效果。实验结果表明,硬件加速器在占用少量资源的同时,相较于通用

计算机上的软件实现,可获得约70~180倍的效率提升,能够满足多路复用测序

中测序条形码的实时识别需求。

关键词:复用测序,测序条形码,动态规划,脉动阵列

ABSTRACT

Withthecontinuousimprovementofthesequencingthroughputofthethird

generationdeoxyribonucleicacid(DNA)sequencingtechnology,themultiplexed

sequencingtechnologyusingtheDNAsequencingbarcodestosequencemultiple

samplesinparallelhasbecomeakeystrategytoeffectivelyutilizethesequencing

capabilitiesofthird-generationsequencingequipment.Inviewofthecomplex

sequencingerrors,especiallyinsertionanddeletionerrors,researchersproposeda

numberofmethodsforconstructinganddecodingDNAbarcodeswithdifferent

capacitiesandrobustnesswiththehelpoferrorcorrectingcodes(suchasLevenshtein

codes)incommunicationsystems.However,duetothelargeamountofsequencedata

generatedbynext-generationsequencingtechnology,andthecomplexityofDNA

sequencingbarcodeidentificationisoftenhigh,i

文档评论(0)

营销资料库 + 关注
实名认证
文档贡献者

本账号发布文档部分来源于互联网,仅用于技术分享交流用,版权为原作者所有。 2,文档内容部分来自网络意见,与本账号立场无关。

1亿VIP精品文档

相关文档