基于条件随机场的无监督中文词性标注-计算机应用与软件.pdfVIP

  • 22
  • 0
  • 约 4页
  • 2018-06-07 发布于天津
  • 举报

基于条件随机场的无监督中文词性标注-计算机应用与软件.pdf

基于条件随机场的无监督中文词性标注-计算机应用与软件

第28卷第4期    计算机应用与软件 Vol28No.4 2011年4月   ComputerApplicationsandSoftware Apr.2011 基于条件随机场的无监督中文词性标注 孙 静 李军辉 周国栋 (苏州大学计算机科学与技术学院 江苏苏州215006) 摘 要  中文词性标注是中文信息处理领域的一项基础工作。提出了一种基于条件随机场CRFs(ConditionalRandomFields)模 型的无监督的中文词性标注方法。首先利用词典对获得的已分好词的生文本进行词性标注,得到初始标注语料,然后利用CRFs对 语料进行迭代标注,逐步优化标注结果。并以宾州树库为实验语料,考察了不同规模的标注数据对模型性能的影响,在四份不同规 模语料上的实验表明,词性标注正确率提高了1.88%~2.26%。 关键词  条件随机场 无监督学习 词性标注 ANUNSUPERVISEDCHINESEPARTOFSPEECHTAGGIN

文档评论(0)

1亿VIP精品文档

相关文档