- 1
- 0
- 约8.84千字
- 约 8页
- 2017-06-09 发布于天津
- 举报
基于角色标注的中国人名自动识别研究张华平刘群中国科学院计算技术研究所软件实验室北京摘要中国人名的识别是中文未登录词识别的重点和难点目前的解决方案自身存在一些本质的缺陷实际效果还难以满足实际需求本文提出了一种基于角色标注的中国人名自动识别方法即利用从语料库中自动抽取的角色信息采取算法对切词结果进行角色标注在角色序列的基础上进行模式最大匹配最终实现中国人名的识别通过对字节真实语料库的封闭与开放测试该方法取得了接近的召回率准确率也得到了实际提高实验数据证明该方法是行之有效能够成功解决中国人名的自动识别
基于角色标注的中国人名自动识别研究
张华平
zhanghp@software.ict.ac.cn 刘群 (Liu Qun)
Liuqun@ ict.ac.cn 中国科学院计算技术研究所软件实验室 北京 100080
摘要:中国人名的识别是中文未登录词识别的重点和难点,目前的解决方案自身存在一些本质的缺陷,实际效果还难以满足实际需求。本文提出了一种基于角色标注的中国人名自动识别方法。即:利用从语料库中自动抽取的角色信息,采取Viterbi算法对切词结果进行角色标注,在角色序列的基础上,进行模式最大匹配,最终实现中国人名的识别。通过对16M字节真实语料库的封闭与开放测试,该方法取得了接近98%的
您可能关注的文档
最近下载
- 数字图像处理图像编码.ppt VIP
- 湖北城市建设职业职业技术学院2025年高职单招考试城市燃气工程技术专业考试大纲.pdf VIP
- 长帝电烤箱TV42W使用说明书用户手册.pdf
- 气象学与气候学课件.pptx
- 电子科技大学《光电图像处理》 第六章 图像编码与压缩 ppt课件.pptx VIP
- 对外经济贸易大学2021-2022学年《Python程序设计》期末考试试卷(A卷)及标准答案.docx
- 高考数学极值点偏移练习题(含答案).docx VIP
- 化工过程安全管理导则-装置安全规划与设计课件.pptx VIP
- 五脏与情志 jt叔叔 JT叔叔伤寒杂病论慢慢教(.)五脏与情志.doc VIP
- 图像处理与分析图像的编码技术.ppt VIP
原创力文档

文档评论(0)