- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
面向多口音语音识别的声学模型重构方法.PDF
第十一届全国人机语音通讯学术会议
面向多口音语音识别的声学模型重构方法
1,2 1 1
张超 ,刘 轶 ,郑 方
(1. 清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心,北京 100084;
2. 清华大学 计算机科学与技术系,北京 100094)
摘摘 要:要:该文提出了应用声学似然分作为置信度来生成可靠口 通话有着显著的差异。由于多数普通话使用者把普
摘摘 要要::
音相关单元的方法。基于可靠口音相关单元构造声学模型,并 通话作为第二语言来掌握,他们的普通话发音不可
通过声学模型重构的方法将它们融合到标准普通话模型中,以 避免地受到其方言母语发音的强烈影响[2] 。相关文
改善普通话语音识别器对带多方言口音语音的识别效果。另 献指出,80%左右的普通话使用者带有不同程度的
[3]
外,还提出了使用增量式决策树融合及根据支配度选择 Gauss 方言口音 。由前所述,方言口音在汉语语音中是
混合 2 种方法来减少冗余的 Gauss 混合,从而提高了重构后的 一个严重的问题。实践表明:当说话人带有某种方
声学模型的效率。实验表明:该方法在不降低对标准普通话的 言口音时,针对标准普通话构造的语音识别器的性
识别率的前提下,对粤、吴口音的绝对音节错误率分别下降了 能往往会大幅下降。
9.25%和 9.21%。 口音相关单元 (accent specific uni )常用来表
关键词关键词:语音识别: ;多方言口音;可靠口音相关单元;声学 征口音中的发音变异,并有多种使用方法。其中,
关键词关键词::
模型重构 用口音相关单元来扩展发音基元是一种被广泛采
中图分类号中图分类号::TN912.3 用的办法[4-5] 。然而,引入的扩展发音基元以及带有
中图分类号中图分类号::
多种候选发音的多发音字典往往会增加语音识别
Acoustic model reconstruction for 器的词汇混淆度。Oh 和 Kim 利用发音变异基元在
multi-accent Chinese speech recognition 最大后验概率(maximum a posteriori,MAP)和最大
似然线性回归(maximum likelihood linear regression)
您可能关注的文档
最近下载
- 5.2《大学之道》课件(共39张PPT) 2025-2026学年统编版高中语文选择性必修上册.pptx VIP
- 椭圆标准方程导学案.doc VIP
- 单片机烟雾检测报警系统设计方案.docx VIP
- 发那科Line tracking-追踪说明.pdf VIP
- 眼组织解剖与生理.ppt VIP
- 发那科机器人Line Tracking(直线追踪)FANUC.pdf VIP
- 眼的组织解剖和生理-医学课件.ppt VIP
- 2025年警务辅助人员招聘考试(时事政治+公安基础知识)题库.docx VIP
- 眼组织解剖生理.ppt VIP
- (2025年高考真题解读课件)2025年高考地理真题完全解读(河南卷).pptx VIP
原创力文档


文档评论(0)