- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文校对系统中纠错知识库的构造及纠错建议的产生算法中文信息学报.PDF
中 文 信 息 学 报
第 15 卷 第 5 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 15 No. 5
中文校对系统中纠错知识库的构造及
纠 错 建 议 的 产 生 算 法
张仰森
( 山西大学计算机科学系 太原 030006 ;
中国科学院自动化研究所模式识别国家重点实验室 北京 100080)
摘要 :本文依据待校对文本中的常见错误类型介绍了纠错知识库的构造方法以及基于该
纠错知识库的自动纠错算法 。该算法通过利用出错字串的特征 ,结合上下文启发信息 ,可有效
地对文本中的别字 、漏字 、多字 、易位 、多字替换等错误提供纠错建议 。文中还对纠错建议的排
序算法进行了讨论 。
关键词 :纠错知识库 ;纠错建议 ;纠错算法 ;似然匹配
中图分类号 : TP39 1
The Structuring Method of Correcting Knowledge Sets and the
Producing Al gorithm of Correcting Suggestion in the
Chinese Text Proof reading System
ZHAN G Yangsen1 ,2
( 1. Comp uter science dep art ment ,Shanxi U niver sit y Taiyuan 030006 ;
2 . N ational L aboratory of Pattern Recognition , Instit ute of
Automation ,Chinese Academy of Sciences Beij ing 100080)
Abstract :Accor ding to common error types in p rep roofreading text , t his p aper int roduce t he
met hod to st ruct ure correcting knowledge set s and a automatic correcting algorit hm based on t his
correcting knowledge set s. The algorit hm makes a full use of t he characteristics of wrong st rings
and context heuristic information . It can p rovide correcting suggestions for such error s as gho st
wor d ,missed Chinese character s , superfluous Chinese character s ,rever sed Chinese character s and
substit uted Chinese character s etc . The met hod of sorting t he correcting suggestions is also dis
cussed .
收稿 日期 :2000 - 07 - 12 ;修改稿收到日期 :2000 - 12 - 07
( )
基金项 目: 山西省自然科学基金 98103 1
作者张仰森 ,男 ,1962 年生 ,教授 ,主要研究领域为人工智能和中文信息处理.
您可能关注的文档
- 中国的有轨电车车辆Dresdende.PDF
- 中国科学院南京地理与湖泊研究所博士论文答辩快猴网.ppt
- 中国童子军总会函台北市童军会.doc
- 中国通航飞行员培训市场存在供需悖论.doc
- 中国限制出口技术出口申请书.doc
- 中央民族大学年一带一路留学生奖学金申请办法MUC.doc
- 中央财政服务项目的结案行政档案中国社会组织.ppt
- 中子散斑是否可行Indico.ppt
- 中学大学双修课程课程简介课程宗旨课程结构香港科技大学资优.PDF
- 中学生杂志我来编主题阅读交流.ppt
- 河北省饶阳中学2025届高考适应性考试物理试卷含解析.doc
- 甘肃省靖远县2025届高三第三次模拟考试物理试卷含解析.doc
- 福建省长乐中学2025届高三适应性调研考试物理试题含解析.doc
- 2025年起重锚链行业深度研究分析报告_20241226_182944.docx
- 2025届辽宁省丹东市凤城市高三下学期联考物理试题含解析.doc
- 化学教育:探索可再生能源技术-环境科学家的角色.pptx
- 2025届山东省聊城市东阿县行知学校高考全国统考预测密卷物理试卷含解析.doc
- 施工项目部新员工入场安全教育.pdf
- 2025届湖北省重点中学高三第二次调研物理试卷含解析.doc
- 山东省宁阳县第一中学2025届高三二诊模拟考试物理试卷含解析.doc
文档评论(0)