- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SSE2的高性能串匹配算法研究水
蛾正华.徐琳,冯圣中
中国科学院计算技术研究所
{dzII;xuIin;fsz}@ncic.∽.cn
摘要:字符串的模式匹配性能的提高会给众多相关领域带来巨大的影响,本文选取了最常应用
的字符串模式匹配算法一朴素串匹配算法进行基于SSE2的优化,结果表明,基于SSE2的模
式匹配算法性能明显好于C语言提供的strStr()函数.如何有效利用数据局部性是提高程序性能
的一条关键因素,如何将数据快速装入xMMS寄存器是该算法要解决的一个主要问题.
1引言
字符串的模式匹配性能的提高会给众多相关领域带来巨大的影响,如多媒体内容分析与检
索、生物信息处理等应用.需要频繁使用字符串的模式匹配算法。目前对串行串匹配算法的研究
已经相对成熟。对并行串匹配算法的研究主要集中在如何对其进行线程级、任务级的并行化以期
在并行系统中能得到良好应用。目前高性能软件主要应用在大型并行系统中。故对高性能算法、
高性能软件的研究也主要集中在如何发掘算法的线程级、任务级的并行性。为了获得更高的性
能,需要根据运行平台的不同对程序进行改进,以牺牲通用性为代价来获得性能的提高。
SIMDExtensions
SsE2(Stre锄ing 2)是InteI为提高处理流媒体的性能而推出的多媒体向量指令
集。目前,SSE2在数字图像处理、视频处理、音频处理等多媒体处理领域已得到广泛应用。将这
种指令集应用到字符串的模式匹配问题中.充分挖掘该算法的数据局部性.在指令级并行优化原
来的串行算法.将可以大幅度提高计算速度,最好情况下甚至可以提高十多倍。本文首先分析了
gIibc库函数s仃s呱)的特点.利用SSE2指令重写了这种算法,并分析了适合这种算法的数据特征。
2st璐tro函数与SSE2指令集
g】ibc库函数s仃S砥)采用朴素串匹配算法。其C语言描述如下:
ch盯‘stnnatch(char’subject,ch盯’qua巧)
{
int
iJ,k;
int
m=strlen(qua叮);//模式串长度
int
n=s仃Ien(subject);//目标串长度
f0“i-0;i=n·m;i++)
{
j=O;k=i;
while(jmsubject【k】==qua哆【i】)
{k++.J++;}
69
i坟j==m)retumchar宰(subject+i);//i为有效位移,否则查找下一个位移
)//cndfor
remm.1://找不到有效位移。匹配失败
}
其算法复杂度为O(mn).理论上朴素匹配算法性能远差于KMP、Boyer
间复杂度为o(I(ft))等算法。但由于在具体应用中,最坏情况是极少出现的,大多数应用中若前,个
字符匹配,则整个模式串匹配的概率远大于砌。而模式串的长度远小于目标串的长度,朋小于或
较好的性能:将模式串第一个字符a、第二个字符b存于寄存器中。从目标串中快速寻找与ab匹配
的位置x,肌+2处继续匹配,若成功则返回,不成功触+l处继续寻找与ab匹配的位置。直到结
束。
1997年,Intel
数(doubIe
set、store),其他指令(shift、pack、岫pack、shu用e)。
3基于SSE2的串匹配算法
在工作过程中。遇到一类特殊应用,模式串的长度为“位或128位。针对这种特殊应用,用
SSE2指令实现了串匹配算法,取得了良好的效果。为了提高程序执行效率,算法实现采用内嵌汇
编方式。
算法思想:每次从目标串中取出16字节,作为一个整体,利用SSE2指令,与模式串进行匹
配。这样,理论上,对于长度为16字节的模式串,其时间复杂度可由原来的16×力降到,,。
下面是算法的C语言描述:
strmacchsse2(char+psubjectchar·qua秽)
{
—-m128dnmpl28d,mql28d,iql28d;
您可能关注的文档
- 基于三棱柱单元地层与桩基的可视化研讨.pdf
- 基于SPC的计算机辅助质量控制系统研究.pdf
- 基于Spearman秩的灰色关联与企业竞争力定量识别研究.pdf
- 基于三探测技术的变压器在线监测系统研究.pdf
- 基于三维CAD的中国古典建筑造型设计研究.pdf
- 基于SPH的水与固体交互仿真建模方法研究.pdf
- 基于三维GIS的智能化生态观光农业的建设——以福建省琅岐岛为例研究.pdf
- 基于三维磁场仿真分析的含永磁继电器等效磁路模型的建立研究.pdf
- 基于SPICE的单电子器件和电路模拟器研究.pdf
- 基于SPIN的协议分析技术研讨.pdf
- 基于三维直角网格Euler方程并行计算的气动布局优化研讨.pdf
- 基于三相非对称Cuk斩波器的感应电机软启动研究.pdf
- 基于SSH的Bursaphelenchus+zylophilus和Bmucronatus基因差异表达分析研究.pdf
- 基于三向责任的生态旅游理论与实践——以王朗自然保护区为例研究.pdf
- 基于三种软件平台的高分辨率遥感影像融合试验及结果分析研究.pdf
- 基于三坐标测量机的并联机器人运动学标定研究.pdf
- 基于三坐标测量机激光拼焊板材直线度研讨.pdf
- 基于一般均衡理论的转移支付影响研讨.pdf
- 基于一级泛与运算模型的命题模糊逻辑研究.pdf
- 基于一阶微分图像的指纹图像分割方法研究.pdf
最近下载
- 2022年上海市春季高考语文真题试卷含详解与写作参考范文.docx VIP
- 2023年上海市春季高考语文试卷真题含答案及评分标准.pdf VIP
- 运动会铅球宣传稿.docx VIP
- 《离心机 安全要求gb 19815-2021》详细解读.pdf
- 2025年1月上海市春季高考语文真题(附答案解析).docx VIP
- 2025湖北银行笔试题库及答案.doc VIP
- 2025年上海市高考语文真题试卷及答案.docx VIP
- 《国有企业管理人员处分条例》课件.pptx VIP
- 58同城如何发布房屋出租信息?房屋出租技巧?.doc VIP
- 人教版高中英语必修第一册《UNIT 3 SPORTS AND FITNESS》大单元整体教学设计.docx
文档评论(0)