网站大量收购独家精品文档,联系QQ:2885784924

基于字符编辑的字符串匹配算法的实现.pdf

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于字符编辑的字符串匹配算法的实现

毕毕 业业 论论 文(文 (设设 计)计) 毕毕 业业 论论 文文 ((设设 计计)) 作作 者者: xxx 学 学 号号:: xxx 作作 者者 学学 号号:: 系系 部部: 信息科学与工程系 系系 部部 专专 业业: 计算机科学与技术 专专 业业 题题 目目: 基于字符编辑的字符串 题题 目目 匹配算法的实现 指导老师指导老师 xxx 讲师 指导老指导老师师 提交日期提交日期 2010 年 5 月 15 日 提交日提交日期期 xxx大学xxx学院 毕业论文(设计) 基于字符编辑的字符串匹配算法的实现基于字符编辑的字符串匹配算法的实现 基于字符编辑的字符串匹配算法的实现基于字符编辑的字符串匹配算法的实现 摘 摘 要要 摘摘 要要 随着信息技术的迅猛发展,各种数据生成以及数据采集设备的广泛使用,人们获 取到的数据量指数级增长,但是人们从海量数据中获取信息的方便性并没有得到有效 的改善,究其原因,其一就是数据质量大大下降,不足以满足应用的需求。 本文介绍了对数据质量研究的必要性以及目前数据质量研究的热点,并着重介绍 通过记录连接来改善数据质量问题。通过匹配技术中的编辑距离算法、Jaro-Winkler 算法达到进行记录连接的目的,并对算法的原理及其实现作了阐述,通过计算两个记 录的相似度来解决基于字符编辑的字符串匹配问题,实现对重复相似记录的检测以达 到数据连接的目的,最后对匹配技术对数据质量研究的展望。 关键词:关键词:数据质量; 记录连接; 匹配; 编辑距离; Levenshtein算法; Jaro-Winkler 关键词关键词:: 算法 i xxx大学xxx学院 毕业论文(设计) String Matching Algorithm and its Realization Based on Character Editor ABSTRACT With the rapid develop

您可能关注的文档

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档