- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10 2005高性能计算应用大会
FM-i
ndex算法加速压缩文件字符串查找的
性能测试及并行化初探
张广治 张云泉
(中国科学院软件研究所并行计算实验室北京100080zhanggz@mail.rdcps.ac.cn
中国科学院计算机科学国家重点实验室北京100080zyq@mail.rdcps.ac.anJ
【摘要】本文概括介绍了FM~index压缩查询技术,详细阐述了FM—index的工作流程,描述了实现计算字
符串在压缩文本中出现次数的算法。对FM—index的源代码在Linux平台上进行了测试,从测试结果分析了
使用FM—index进行压缩查询的优点和不足。在最后给出了加快FM—index压缩速度的一个并行化算法的初
步设计思路。
关键字:FM—index,压缩查询,BW转换,后缀数组
searchin
Acceleratingstring compressed
textwithFM.index
ZhangGuangZhiZhangYunQuan
Parallel of of 1
(Lab.of Software,ChineseAcademy 00080)
Computing,Institute Sciences,Beijing
(StateKeyLab.ofComputerScience,InstituteofSoftware,ChineseAcademyofSciences,Beijing100080)
(zhanggz@mail.rdcps.ac.cnzyq@mail.rdcps.fie,ca)
Abatract:FM-indexisanew for text.Inthis introducedthe
searching
technology compressed paper,we working
ofFM—indexand the in text.Thesourcecode
occurrence
procedure analyzedalgorithmofcountingstring compressed
ofFM—indexistestedontwokindsofLinux basedonthe summarizedthe
results,we
platforms.Finallyexperimental
of FM—indextosearch text.
advantagesadopting compressed
Keyword:FM—index,searchcompressedtext,BWtransform,suffixarray
1引言 且查询字符串在文本中的出现次数操作非常快。
如何寻找查询修改时间和空间占用的平衡方
目前处理器速度提高得比硬盘速度快,这样 案是目前设计数据结构索引
您可能关注的文档
- HT高密封性特殊螺纹套管在气井中的应用研究.pdf
- Ht公司的营销策略研讨.pdf
- Human Resource Accounting Identification of Vagables——A Classification toward Company Strategy研究.pdf
- HUNTSMAN+农化助剂在农药新剂型中的应用研究.pdf
- Hurst参数变化在网络流量异常检测中的应用研讨.pdf
- HVAF+WC涂层对超高强钢疲劳断裂性能的影响研究.pdf
- HVDC+和FACTS+装置及其对次同步振荡的影响初探研究.pdf
- HVDC电压波动在线处理的原理与实践研究.pdf
- FeCrAl合金中富铬相的高温氧化膜研究.pdf
- FLEX系统中CNET控制器的软硬件设置研究.pdf
文档评论(0)