现代语音信号处理(Python版)教学课件第10章 语音识别N.ppt

现代语音信号处理(Python版)教学课件第10章 语音识别N.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10.6 性能评测 1)词错误率(Word Error Rate,WER):为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入、替换或删除的词的总个数,除以标准的词序列中词的总个数的百分比,即为WER。计算公式为: 2)句错误率(Sentence Error Rate,SER):句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的个数除以总的句子个数即为SER。 其它因素 1)识别对象中词汇量的多少,识别对象间声学特性的相似程度等; 2)系统是针对特定话者还是多数话者或者非特定话者的识别系统; 3)系统是孤立发音(单词或音节单位)、词组单位发音(例如汉语习惯上的发音停顿的位置)、还是连续发音、是正规的朗读语音还是较自由的会话语音; 4)发音的环境是隔音室、安静的房间还是噪声环境; 5)话筒的位置在什么地方,是否是位置自由的; 6)语音的频带限制,如是否是电话语音带宽等; 7)其他方面,如通用性、经济性、鲁棒性、识别速度,是否能够进行在线识别、语言模型的覆盖率等。 10.7 系统总结 实用语音识别研究中存在的主要问题和困难如下: (1)自然语言的识别和理解困难。 (2)语音信息的变化很大。 (3)语音的模糊性。 (4)单个字母及单个词语发音时的语音特性会受上下文环境影响,使相同字母有不同的语音特性。 (5)环境噪声和干扰对语音识别有严重影响。 /it/detail_2011_11/040.shtml?_from_ralated * 其中,激活函数g为矫正的线性激活函数 * 其中,激活函数g为矫正的线性激活函数 * 10.4.2 隐马尔可夫模型的定义 3)HMM的基本元素 A:状态转移概率的集合。所有转移概率可以构成一个转移概率矩阵,即 其中, aij(k)是从状态Si到状态Sj时的转移概率。在球与缸实验中,其描述了选取当前缸的条件下选取下一个缸的概率。 B:输出观测值概率的集合。B={bij(k)},其中bij(k)是从状态Si到状态Sj转移时观测值符号k的输出概率,即缸中球的颜色k出现的概率。 F:系统终了状态的集合。 10.4.2 隐马尔可夫模型的定义 3)HMM的基本元素 严格来说Markov模型是没有终了状态的,只是语音识别的Markov模型要设定终了状态。因此,一个HMM可记为 : 可简写为: 因此,HMM可分为两部分:一个是Markov链,由π 、A描述,产生的输出为状态序列;另一个是一个随机过程,由B描述,产生的输出为观察值序列。 HMM的三个基本问题 1.评估问题:对于给定模型,求某个观察值序列的概率P(O|λ) 2.解码问题:对于给定模型和观察值序列,求可能性最大的状态序列maxQ{P(S|O,λ)} 3.学习问题:对于给定的一个观察值序列O,调整参数λ,使得观察值出现的概率P(O|λ)最大 赌场的欺诈 某赌场在掷骰子时采用的作弊方法: 在连续多次掷骰子的过程中,通常使用公平骰子A,偶而混入一个灌铅骰子B。 A B 0.9 0.1 0.2 公平骰子 灌铅骰子 0.8 骰子A 骰子B 1点 1/6 0 2点 1/6 1/8 3点 1/6 1/8 4点 1/6 3/16 5点 1/6 3/16 6点 1/6 3/8 公平骰子A与灌铅骰子B的区别: 时间 1 2 3 4 5 6 7 骰子 A A A B A A A 掷出 点数 3 3 4 5 1 6 2 一次连续掷骰子的过程模拟 查封赌场后, 调查人员发现了一些连续掷骰子的记录,其中有一个骰子掷出的点数记录如下: 124552646214614613613666166466163661636616361651561511514612356234 … 隐序列 明序列 给定:一个骰子掷出的点数记录 124552646214614613613666166466163661636616361651561511514612356234 评估问题:会出现这个点数记录的概率有多大?求P(O|λ) 解码问题:点数序列中的哪些点数是用骰子B掷出的? 求maxQ{P(S|O,λ)} 学习问题: 作弊骰子掷出各点数的概率是怎样的?公平骰子掷出各点数的概率又是怎样的 ? 赌场是何时换用骰子的 ? 隐状态集: S={骰子A, 骰子B} 明字符集: V={1,2,3,4,5,6} 初始状态概率: π1=1, π2=0 隐状态转移概率 : a11=0.9, a12=0.1 a21=0.8, a22=0.2 初始状态 明字符生成概率 : b11 = b12=…=b16=1/6 b21=0, b22=b

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

知识共享

1亿VIP精品文档

相关文档