基于无向图序列标注模型的中文分词词性标注一体化-电子与信息学报.pdfVIP

  • 8
  • 0
  • 约2.03万字
  • 约 5页
  • 2018-06-07 发布于天津
  • 举报

基于无向图序列标注模型的中文分词词性标注一体化-电子与信息学报.pdf

基于无向图序列标注模型的中文分词词性标注一体化-电子与信息学报

第 32 卷第 3 期 电 子 与 信 息 学 报 Vol.32No.3 2010 年 3 月 Journal of Electronics Information Technology Mar.2010 基于无向图序列标注模型的中文分词词性标注一体化系统 朱聪慧 赵铁军 郑德权 - (教育部微软语言语音重点实验室哈尔滨工业大学 哈尔滨 150001) 摘 要:在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减 少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标 注有机地统一在一个序列标注模型中。由于可以采用更深层次的依赖关系作为特征,一体化系统在 1998 年人民日 报语料上取得了 97.19%的分词精确率和 95.34%的词性标注精确率,是目前同

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档