HMM词性标注模型及其参数学习与推断方法.pdfVIP

  • 0
  • 0
  • 约1.87千字
  • 约 4页
  • 2026-05-25 发布于北京
  • 举报

HMM词性标注模型及其参数学习与推断方法.pdf

HMM词性标注

Friday,April17,202012:43PM

HMM对词性标注建模

模型变量和参数

隐状态:词性(K个)

观测值:词汇(V个)

初始概率:pi,句首词性的概率分布,维度(K,1)

状态转移矩阵:A,从当前词性转移到其他词性的概率分布,维度(K,K)

概率矩阵:B,给定词性下词汇的概率分布,维度(K,V)

参数学习

非监督:EM

有监督:最大似然,统计计算

A[i][j]=Nij/Ni

B[i][v]=Niv/Ni

Pi[i]=N0i/N0

一个例子

语料:

你/(代),是/(动),程序员/(名)

我/(代),是/(动),程序员/(名)

我们/(代)都/(副)是/(动)程序员/(名)

统计结果和参数估计:

观测/词汇集合:{你,我,我们,是,程序员,都}

隐状态/词

文档评论(0)

1亿VIP精品文档

相关文档