基于隐马模型的人名自动识别研究.docVIP

  • 1
  • 0
  • 约8.84千字
  • 约 8页
  • 2017-06-09 发布于天津
  • 举报
基于角色标注的中国人名自动识别研究张华平刘群中国科学院计算技术研究所软件实验室北京摘要中国人名的识别是中文未登录词识别的重点和难点目前的解决方案自身存在一些本质的缺陷实际效果还难以满足实际需求本文提出了一种基于角色标注的中国人名自动识别方法即利用从语料库中自动抽取的角色信息采取算法对切词结果进行角色标注在角色序列的基础上进行模式最大匹配最终实现中国人名的识别通过对字节真实语料库的封闭与开放测试该方法取得了接近的召回率准确率也得到了实际提高实验数据证明该方法是行之有效能够成功解决中国人名的自动识别

基于角色标注的中国人名自动识别研究 张华平 zhanghp@software.ict.ac.cn 刘群 (Liu Qun) Liuqun@ ict.ac.cn 中国科学院计算技术研究所软件实验室 北京 100080 摘要:中国人名的识别是中文未登录词识别的重点和难点,目前的解决方案自身存在一些本质的缺陷,实际效果还难以满足实际需求。本文提出了一种基于角色标注的中国人名自动识别方法。即:利用从语料库中自动抽取的角色信息,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的

文档评论(0)

1亿VIP精品文档

相关文档