基于规则与统计相结合的中文文本自动查错模型与算法.pdfVIP

  • 16
  • 0
  • 约2.45万字
  • 约 8页
  • 2017-09-03 发布于北京
  • 举报

基于规则与统计相结合的中文文本自动查错模型与算法.pdf

中文信息学报 第20 辑第4 期 JOURNAL OF CIßNESE INFORMATION PROCESSING Vol. 20 NO.4 文章编号:1∞3 州77(2附)04 四删1-07 基于规则与统计相结合的中文文本自动查锚模型均算法 张仰森1 气曹元大2 ,俞士汶1 (1.北京大学计算谱育学研究所,北京 100871; 2. 北京理工大学计算机科学工程系,北京 1创浏阳; 3. 北京信息科技大学计算机及自动化系,北京阳的) 摘堕:中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了…种规则与统计相结 合的中文文本自动变错模裂与算法。根据正确文本分词后单字词的出现规律以及非多字词错误的概念, 提出一级错误发现规则,并与针对分饲后单字教串建立的字二元、二元统计模型和饲性二元、二元统计模型相 结合,建立了文本自动最错模型与实现算法。通过对30 篇舍有578 个错误测试点的文本进行实革命,所提算法 的最错召回亭为 86.85% 、准确...为 69.43% ,误报牟为 30.57% 0 关键询:计算机应用;中文信息

文档评论(0)

1亿VIP精品文档

相关文档