网站大量收购闲置独家精品文档,联系QQ:2885784924

中文校对系统中纠错知识库的构造及纠错建议的产生算法中文信息学报.PDFVIP

中文校对系统中纠错知识库的构造及纠错建议的产生算法中文信息学报.PDF

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文校对系统中纠错知识库的构造及纠错建议的产生算法中文信息学报.PDF

中 文  信  息  学  报 第 15 卷 第 5 期   JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 15 No. 5 中文校对系统中纠错知识库的构造及 纠 错 建 议 的 产 生 算 法 张仰森 ( 山西大学计算机科学系  太原  030006 ; 中国科学院自动化研究所模式识别国家重点实验室  北京  100080) 摘要 :本文依据待校对文本中的常见错误类型介绍了纠错知识库的构造方法以及基于该 纠错知识库的自动纠错算法 。该算法通过利用出错字串的特征 ,结合上下文启发信息 ,可有效 地对文本中的别字 、漏字 、多字 、易位 、多字替换等错误提供纠错建议 。文中还对纠错建议的排 序算法进行了讨论 。 关键词 :纠错知识库 ;纠错建议 ;纠错算法 ;似然匹配 中图分类号 : TP39 1 The Structuring Method of Correcting Knowledge Sets and the Producing Al gorithm of Correcting Suggestion in the Chinese Text Proof reading System ZHAN G Yangsen1 ,2 ( 1. Comp uter science dep art ment ,Shanxi U niver sit y  Taiyuan  030006 ; 2 . N ational L aboratory of Pattern Recognition , Instit ute of Automation ,Chinese Academy of Sciences  Beij ing  100080) Abstract :Accor ding to common error types in p rep roofreading text , t his p aper int roduce t he met hod to st ruct ure correcting knowledge set s and a automatic correcting algorit hm based on t his correcting knowledge set s. The algorit hm makes a full use of t he characteristics of wrong st rings and context heuristic information . It can p rovide correcting suggestions for such error s as gho st wor d ,missed Chinese character s , superfluous Chinese character s ,rever sed Chinese character s and substit uted Chinese character s etc . The met hod of sorting t he correcting suggestions is also dis cussed . 收稿 日期 :2000 - 07 - 12 ;修改稿收到日期 :2000 - 12 - 07 ( ) 基金项 目: 山西省自然科学基金 98103 1 作者张仰森 ,男 ,1962 年生 ,教授 ,主要研究领域为人工智能和中文信息处理.

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档