- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 隐马尔可夫模型(HMM) 语音信号处理 课件教学 讲义.ppt
目前的性能 容易评价,只需计算标注正确的词性数量 目前准确率大约在97%左右 Baseline也可以达到90% Baseline算法: 对每一个词用它的最高频的词性进行标注 未登录词全部标为名词 词性标注 P(T|W)=P(W|T)P(T)/P(W) argmaxTp(T|W)=argmaxTp(W|T)p(T) P(W|T)=∏i=1…dp(wi|w1,…,wi-1,t1,…,td) p(wi|w1,…,wi-1,t1,…,td) ≌p(wi|ti) P(T)=∏i=1…dp(ti|t1,…,ti-1) p(ti|t1,…,ti-1)=p(ti|ti-n+1,…,ti-1) 有指导的学习 训练时事先对语料库进行了人工的词性标注,因此在训练时看到了状态(词性),属于VMM,在测试时,只能看到观察值(词序列),因此属于HMM。 应用最大似然估计 p(wi|ti)=cwt(ti,wi)/ct(ti) p(ti|ti-n+1,…,ti-1) =ctn(ti-n+1,…,ti-1,ti)/ct(n-1)(ti-n+1,…,ti-1) 平滑 p(wi|ti):加1平滑 p(ti|ti-n+1,…,ti-1):线性差值 用带标记的语料进行训练 Pierre/NNP Vinken/NNP , , 61/CD years/NNS old/JJ ,/, will/MD join/VB the/DT board/NN as/IN a/DT nonexecutive/JJ director/NN Nov./NNP 29/CD ./. Mr./NNP Vinken/NNP is/VBZ chairman/NN of/IN Elsevier/NNP N.V./NNP ,/, the/DT Dutch/NNP publishing/VBG group/NN . . Rudolph/NNP Agnew/NNP ,/, 55/CD years/NNS old/JJ and/CC former/JJ chairman/NN of/IN Consolidated/NNP Gold/NNP Fields/NNP PLC/NNP ,/, was/VBD named/VBN a/DT nonexecutive/JJ director/NN of/IN this/DT British/JJ industrial/JJ conglomerate/NN ./. c(JJ)=7 c(JJ, NN)=4, P(NN|JJ)=4/7 无指导的学习 语料库只是词的序列,没有人工标注词性,是Plain Text。 完全无指导的学习是不可能的 至少要知道: 词性集 每个词可能的词性(据词典) 使用Baum-Welch算法 无指导学习的秘诀 语料库(只有两个句子) A lion ran to the rock D N V P D N Aux V The cat slept on the mat D N V P D N V R 我们能够学习到什么? D, N, V的概率大于D, V, V,Cat应该标注为N V, P, D的概率大于V, Aux, D或V, R, D,因此to和on应标为P 未登录词 考虑所有词性 只考虑开放类词性 Uniform(平均分配概率) Unigram(考虑每个词性独立出现的概率) 根据未登录词的前缀和后缀猜测其词性 运行词性标注器 无论是对有指导的学习,还是对无指导的学习,在搜索阶段都一样:使用Viterbi算法! Πn=2.52 bn(人民)=7.37 n n nh c p v n v n a a d n v 9.89 bn(收入)=6.98 ann=2.76 n n nh c p v n v n a a d n v 9.89 20.02 Viterbi示例 argmaxXYZP(XYZ|rry) Viterbi计算 Viterbi算法 三重循环 第一重:遍历每一个观察值 第二重:遍历当前观察值所对应的每一个状态 第三重:遍历能够到达当前观察值当前状态的上一时刻的每一个状态 计算 假设上一时刻为t,t时刻的的状态为i,t+1时刻的状态为j,t+1时刻的观察值为k,则计算: ?j(t+1)=max1?i?N?i(t)aijbijk ?j(t+1)=argmax1?i?N?i(t)aijbijk t+1时刻状态j的返回指针指向t时刻的状态?j(t+1) 输出 三重循环都结束后,在最后时刻找到?值最大的状态,并从该状态开始,根据返回指针查找各时刻的处于最佳路径上的状态,并反序输出。 N-best计算 保留n个
您可能关注的文档
- 第三章 基金信托 金融信托理论与实课件技术方案.ppt
- 第三章 样本特征数 体育统计学 知识介绍.ppt
- 第三章 表生地球化学环境与元素 地球化学勘探 培训讲解.ppt
- 第三章 语音信号分析频域倒谱线性预测 语音信号处理 课件培训讲解.ppt
- 第三章 Lingo基本函数 优化软件与应用 知识介绍.ppt
- 第三章 MCS单片机指令系统与汇编语言《单片机原理与项目实践——基于C语言》课件知识介绍.pptx
- 第三章 保险合同 保险学 知识介绍.ppt
- 第三章 保险的数理基础 《保险学》课件方案策划.ppt
- 第三章 信息服务与用户研究的 信息服务与用户课件教学 讲义.ppt
- 第三章 叶球花球和菜薹的形成生理 蔬菜栽培生理学 教学 讲义.ppt
最近下载
- 2025年安徽皖江高速公路有限公司高速公路收费人员招聘笔试模拟试题及答案解析.docx VIP
- 人体结构与功能教案仅供参考.pptx VIP
- 物探报告范例.pdf VIP
- 三级养老护理员国家职业技能培训模块一项目三任务三协助老年人进行口腔吸痰.pptx VIP
- 2025年安徽皖江高速公路有限公司高速公路收费人员招聘考试备考题库及答案解析.docx VIP
- 2025年安徽皖江高速公路有限公司高速公路收费人员招聘笔试备考试题及答案解析.docx VIP
- 完整版2025年开学思政第一课.ppt VIP
- 2025年安徽皖江高速公路有限公司高速公路收费人员招聘考试备考试题及答案解析.docx VIP
- 写作载体与写作受体.ppt VIP
- 电子科技大学博士、硕士学位授权点一览表最终.docx VIP
文档评论(0)