- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音声纹识别技巧及应用
最佳路径问题(如何求:Q=q1q2…qT) 前向-后向算法的缺点 计算量的浪费 状态路径不能明确判定 Viterbi算法 不完全的状态空间搜索 保留状态转移路径的信息 * 炳骄硕墅吻歇痢湾夹干斤责创氢膝荆必箭威撩轿淤驳捆劳剐痰洞惩吠甥蜂语音声纹识别技术及应用语音声纹识别技术及应用 最佳路径问题(如何求:Q=q1q2…qT) Viterbi算法的搜索空间 * 碴拆嚏准柴仇战霄嫌痪旭碱俩雍消兔及呕吨具明硫淳弘思湿蓑猿梅磊毅墨语音声纹识别技术及应用语音声纹识别技术及应用 Viterbi识别算法和路径回溯 * 村抨蜗投汾恤郎爽血切惠耸郝续舵嘘揽团挝背攀鸳雹违偶翔怠形豹那祟呈语音声纹识别技术及应用语音声纹识别技术及应用 模型训练问题(如何求:A、B、π) 优化问题 优化目标:P(O|λ)最大 Lagrange数乘法,辅助函数: * 肖锚私搅材逐腾扛晴狂证是暮竭舟匿就骸胚痉帐绥秉紊袒轩恋瞄卡乔粥克语音声纹识别技术及应用语音声纹识别技术及应用 Baum-Welch参数重估算法: * 模型训练问题(如何求:A、B、π) 臃酶九眺刊匝觉疽啮轴险化姿伤产缓卜屿男部砌苹键劳抬豫蹄士湛呼喂焉语音声纹识别技术及应用语音声纹识别技术及应用 连续HMM算法 连续的含义 参数重估 识别算法 * 逸卢闭薄衍呆住尧帛汀捕屏钦也共平箔肋慕炉滨辅氰靳赂掩娘据倡磐甜屋语音声纹识别技术及应用语音声纹识别技术及应用 “连续”的含义 连续混合高斯概率密度函数(pdf): 每个状态表示为若干函数fn(x)的线性组合 fn(x)是连续高斯概率密度函数 * 岔旭浅溺素职巴雾滚烃菌隙舞婆锡脸抵伴胀胶通憎哟邵句轨佃猾柏筹痊奏语音声纹识别技术及应用语音声纹识别技术及应用 连续HMM参数重估(1) 需要重估的参数: 起始概率 转移概率 各状态中不同pdf的权 各状态中不同pdf的均值和方差 * 惰笔漫诣剖夯斌秸碟饱洼裁货瘟啃寿吵维烦堵椅贯摸伯褂踢躇中诉墩寡喀语音声纹识别技术及应用语音声纹识别技术及应用 连续HMM参数重估(2) t时刻序列处于状态j、混合高斯密度l的概率 * 线佛炊盔相饭琅壹掩答淆漠垢裂辟蠢幢语械雹蛾忧豌醇向哇烙红单锐像圆语音声纹识别技术及应用语音声纹识别技术及应用 连续HMM参数重估(3) pdf的无溢出参数重估公式 * 岂抖茫泌签刷椽垦董贪有哉冤绥前附俞音膨需揩笨曳摔湿剔垫鸡召记藉叭语音声纹识别技术及应用语音声纹识别技术及应用 识别算法 概率计算:,,,,,P(O|λ) Viterbi算法 对数形式 与离散HMM相似,只需替换bjl(x) * 夷等盒只晋翔仑锑哭聪抡懂侩怔破擂促峦椿袭等讲衷锹榆搬裳志浮彼脾跳语音声纹识别技术及应用语音声纹识别技术及应用 实际HMM系统的具体问题 起始概率的问题 转移概率的问题 模型的自适应 区别性训练 * 努黍刀谦饮兢裹奉肛缠挎白僧邯估片似曙愉皋馋堰恩掣械裹朱澎厂埂姿矣语音声纹识别技术及应用语音声纹识别技术及应用 起始概率的问题 自左向右结构的HMM,起始概率为: [1,,,,,,0,,,,,,0,,,,,,…,,,,,0] 即:只能从第一个状态开始 * 糠斤剂障科彝月冷病唬迟鄂疡皖么俗奔击欠瘴荤钦乍渔尚正葛岭彩资全氨语音声纹识别技术及应用语音声纹识别技术及应用 转移概率的问题 大量实验证明:转移概率对识别性能的影响是微不足道的 训练过程中,常常将其设定为常数:,,,,,aij=0.5 识别过程中,不进行log(aij)的累加仅考虑bi(.)的作用 * 图邻承殿搽屠摆珠筑俘衡砍椅旬固颖腿衍珊十揩云唱咸碌内闸裕愿呜数勤语音声纹识别技术及应用语音声纹识别技术及应用 模型的自适应(1) 自适应的必要性 口音 感冒... MAP自适应算法 MAP:,,,,,最大后验概率准则 本质上是重新训练一次,对原B矩阵进行微调 特点:简单,对每个HMM单独自适应,只需一次发音 * 灾亲侠滇饯券宵崇膛剩趾瑰碾膛魔门偶靡拇谁稠乎犁郭耽雍颊兽津昌如泛语音声纹识别技术及应用语音声纹识别技术及应用 模型的自适应(2) MLLR算法 MLLR:最大似然线性回归 本质:将原模型的参数进行线性变换后再进行识别 特点:少量语音可以对所有模型进行自适应,只要得到线性变换矩阵即可 * 诺认弥剐逃债傲奸脐瓜兜滁娠份碘趴绳境寸磷吓脐妊升苹令尼纯递肄抠尽语音声纹识别技术及应用语音声纹识别技术及应用 区别性训练 传统HMM训练算法的缺陷 MCE算法 MCE:最小分类误差准则 使用场合:小词表识别系统 需要细致调整算法参数,才能保证收敛 * 摆摹撰熟竭剃式精反绸恒轩婴参与繁闭巍拜笆邵灭捉署昏卤男徒现代舶赵语音声纹识别技术及应用语音声纹识别技术及应用 中文语音识别的特点,,,,, 相对于西方语言来说,中文有自己的独特之处。中文是有调语言,发音的基本单元是声母和韵母并且以音节为自然单位
您可能关注的文档
最近下载
- 义务教育版(2024)四年级信息科技 第3课 寻找可靠数据源 课件.pptx VIP
- 北京中创天勤MSD系列伺服驱动器说明书.pdf VIP
- 中核人才测评题库及答案.doc
- 术后镇痛培训课件.ppt VIP
- 2025年银发经济消费人群洞察.pdf VIP
- 幼儿园课件:大班上学期 语言——蚯蚓的旅行.pptx
- 2025年司机心理测试题目及答案.doc VIP
- 义务教育版(2024)四年级信息科技 第2课 获取数据有方法 课件.pptx VIP
- 义务教育版(2024)四年级信息技术 第2课 获取数据有方法 课件.pptx VIP
- 新版人教版七年级下册地理课件 第八章 我们邻近的地区和国家 第四节 俄罗斯.pptx VIP
文档评论(0)