- 4
- 0
- 约1.39万字
- 约 6页
- 2017-11-24 发布于天津
- 举报
中文信息学报汉语语料词性标注自动校对方法的研究ξ
中 文 信 息 学 报
第 18 卷 第 2 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol 18 No2
文章编号 :1003 - 0077 (2004) 02 - 0030 - 06
汉语语料词性标注自动校对方法的研究
钱揖丽 ,郑家恒
( 山西大学 计算机科学系 , 山西 太原 030006)
摘要 :兼类词的词类排歧是汉语语料词性标注中的难点问题 ,它严重影响语料的词性标注质量 。针对这
一难点问题 ,本文提出了一种兼类词词性标注的自动校对方法 。它利用数据挖掘的方法从正确标注的训练语
料中挖掘获取有效信息 , 自动生成兼类词词性校对规则 ,并应用获取的规则实现对机器初始标注语料的自动
校对 ,从而提高语料中兼类词的词性标注质量 。分别对 50 万汉语语料做封闭测试和开放测试 ,结果显示 ,校
您可能关注的文档
- 一种基于云模型的多目标进化算法.pdf
- 2017中国e-learning行业卓越应用年评选申请表.doc
- 一种基于决策信息系统的知识约简算法-计算机工程与应用.pdf
- 一种基于加权语义相似度模型的自动问答系统-东南大学学报.pdf
- 一种基于双层聚类分析的负荷形态组合识别方法-电网技术.pdf
- 一种基于图形数据库的快速电力网络拓扑分析方法-计算机系统应用.pdf
- 一种基于增长模式的交易序列聚类算法-模式识别与人工智能.pdf
- 一种基于复杂网络特征的中文文档关键词抽取算法-模式识别与人工智能.pdf
- 一种基于安全策略的云数据访问控制优化技术-华东理工大学学报.pdf
- 一种基于拓扑控制的独立可信路由框架-信息工程大学学报.pdf
原创力文档

文档评论(0)