基于基本操作序列的编辑距离顺序验证-计算机科学.PDF

基于基本操作序列的编辑距离顺序验证-计算机科学.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于基本操作序列的编辑距离顺序验证-计算机科学

Vo 1. 43 No. 6A 第 43 卷第6A 期 计算机科学 2016 年 6 月 Computer Science June 2016 基于基本操作序列的编辑距离顺序验证 张润梁牛之贤 (太原理工大学计算机科学与技术学院 太原 030024) 摘 要 两字符串的编辑距离是从一个串转换到另一个串所需要的最少基本操作数。编辑距离广泛应用于字符串近 似匹配、字符串相似连接等领域。动态规划法利用编辑距离矩阵来计算两个串的编辑距离,需要计算矩阵中的所有元 素,时间效率低。改进的方法改变了矩阵中元素的计算次序,减少了需要比对的元素,但仍需要比对一半以上的元素, 时间效率还有待提高。提出基于基本操作序列的编辑距离顺序验证方法。首先,分析了基本操作序列的可列性,给出 了列举基本操作序列的方法。然后依次顺序验证基本操作数从小到大的基本操作序列直到某一序列通过验证,得到 其编辑距离。在阂值为 2 的字符串近似搜索实验中发现,所提方法比动态规划l 类方法具有更高的效率。 关键词 近似串搜索,编辑距离,顺序验证,基本操作序列 中图法分类号 TP391 文献标识码 A Sequential Verification Algorithm to Compute Edit Distance ßased on Edit Operation S叫uence ZHANG Run-liang NIU Zhi-xian (College of Computer Science and Technology ,Taiyuan University of Technology ,Taiyuan 030024) Abstract The edit distance between two strings is the minimum number of edit operations required to transform one into another. The edit distance is widely used in approximate string match ,string similarity joins and etc. Dynamic pro- gramming algorithm(DPA) uses an edit distance matrix to compute the edit distance between two strings ,which needs to compute all the elements in the matrix and has poor time efficiency. The progressive method changes the calculation orders of the elements to reduce the calculation numbers ,which still needs to compute half of the elements and whose time efficiency needs to be improved. In our paper ,we proposed a sequential verification algorithm to compute the edit distance based on the edit operation sequenc已 First, we analyzed the enumerable nature of edit operati

您可能关注的文档

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档