中文信息学报汉语语料词性标注自动校对方法的研究ξ.pdfVIP

  • 4
  • 0
  • 约1.39万字
  • 约 6页
  • 2017-11-24 发布于天津
  • 举报

中文信息学报汉语语料词性标注自动校对方法的研究ξ.pdf

中文信息学报汉语语料词性标注自动校对方法的研究ξ

中 文  信  息  学  报 第 18 卷 第 2 期   JOURNAL OF CHINESE INFORMATION PROCESSING Vol 18 No2 文章编号 :1003 - 0077 (2004) 02 - 0030 - 06 汉语语料词性标注自动校对方法的研究 钱揖丽 ,郑家恒 ( 山西大学 计算机科学系 , 山西 太原  030006) 摘要 :兼类词的词类排歧是汉语语料词性标注中的难点问题 ,它严重影响语料的词性标注质量 。针对这 一难点问题 ,本文提出了一种兼类词词性标注的自动校对方法 。它利用数据挖掘的方法从正确标注的训练语 料中挖掘获取有效信息 , 自动生成兼类词词性校对规则 ,并应用获取的规则实现对机器初始标注语料的自动 校对 ,从而提高语料中兼类词的词性标注质量 。分别对 50 万汉语语料做封闭测试和开放测试 ,结果显示 ,校

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档