基于隐马尔科夫的词性标注讲稿by于江德.pptxVIP

  • 7
  • 0
  • 约3.04千字
  • 约 27页
  • 2018-10-12 发布于上海
  • 举报

基于隐马尔科夫的词性标注讲稿by于江德.pptx

基于隐马尔科夫的词性标注讲稿by于江德

内容提要词性标注基于HMM的词性标注基于规则的词性标注二元一元后面经常用到的公式词性标注的任务自然语言中一词多类的现象把这篇报道编辑一下 把/q-p-v-n 这/r 篇/q 报道/v-n 编辑/v-n 一/m-c 下/f-q-vTime flies like an arrow Time/n-v flies/v-n like/p-v an/Det arrow/n所谓词性标注就是用计算机来自动地给文本中的词标注词类(如:名词、动词)。意义为更高层次的自然语言文本加工提供素材为语言学的研究,提供翔实的资料从加工过的文本中获取词类及频度的词性标注知识词性标注的实质:寻找最优路径4×1×1×2×2×2×3=96种可能性,哪种可能性最大?隐马尔可夫模型简要回顾隐马尔可夫模型是在马尔可夫链的基础之上发展起来的。由于实际问题比马尔可夫模型所描述的更为复杂,观察到的事件并不是与状态一一对应,而是通过一组概率分布相联系,这样的模型就称为隐马尔可夫模型(HMM)。HMM是一个双重随机过程,其中之一是马尔可夫链,这是基本随机过程,它描述状态的转移。另一个随机过程描述状态和观察值之间的统计对应关系。这样,站在观察者的角度,只能看到观察值,不像马尔可夫链模型中的观察值和状态一一对应,因此不能直接看到状态,而是通过一个随机过程去感知状态的存在及其特性。因而称之为“隐”马尔可夫模型。HMM的形

文档评论(0)

1亿VIP精品文档

相关文档