- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
苎盔星全曼要曼望堡兰查叁望堡奎苎
语音理解中的容错技术的研究
张建平王作英
清华大学电子工程系北京t00084
擅要本文研究了太词汇量非特定人汉语连续语音识别和理解系统中的吝惜技术.首先.声
学识别嚣产生H个最优(B-best)音节候选及其相应的声学层的概率,再由H个最优音节候选
la
构成一个音节网格(sy儿abIe
ctice).一个容借语言分析嚣被用来搜索谵音节网格并发现
最优的汉字串.由于考虑了额外的可能候选音节,谊最优汉字串的某些宇的音节可能不在原
来的音节网格中.这样,声学屉的一些错误被纠正,语言分析嚣的稳健性(robusteess)得以
提高.我们的实验表明各借分折器能将字的理解正确率从91.83%提高到94.15%.与传统的
无容错技术的基于三元文法模型的分析器相比、错误率下降了28.4譬.
关健词语音理解吝错技术语百模型 N~beet候选 复杂度Levenshtein距离
一、引言
本文将提供语音理解中的容错技术的一些实验结果。我们知道,从一个声学处理器得到
的N个最优候选可能包含替换、插入和删除错误。就替换错误而言,尽管我们能够通过增大
N来减少这种错误,但当N大于10时这种方法不是很有效01并且会增加语言分析器的负担。
因此.对语音识别系统而言,非常需要一个容错分析器能够通过考虑N个最优候选外的可能
音节以容许一些音节错误。在图l中,分析器的正确输Hj可以利用语言学知识,考虑额外可
能的候选得到。虽然正确音节xin羊口qing并币在N个最优候选内,但xlng和qin在~个
最优候选内。一个窨错舒祈器特征提出的尺度(metrits)下考虑这些正确音节。
两种分析器的分析结果:
正确句子: 每天有新鲜的事情发生
tian xfnxiandeshi fa
音节序列:∞ei you qing sheng
笫i个候选:】2l$5l 1}2l
基线(baseline)系统输出:每天有兴现的是亲发生
容错分析器输出: 每灭有新鲜的事情麓生
(}表示正确音节不在N-best候选内)
另外,显然不同的说话人可能有1:同的口音,尤其在中国,in常放谋读成ing,sh误
读成s等。在这种情况下,正确的音节可能不在N个最优候选内。还有,对_i二象听写机遮样
的用于商业h的系统.要求用户读一段长的文章而不出现任何发音错误是很困难的。基j+以
上事实,我们认为窖错技术对实验语音识别系统和商用系统都很重要。尽管本文提出的方法
被用于语音理解,它们对诃法处理,拼音校正和信皇提取中的字符串近似匹配都有甩处”。
奉文安排如下,第2部分介绍了衡量字符串差异的不同方法。另外,我们实现r计算字
符串不同编辑距离(editdistance)的新的算法。第3部分描述了我们的汉语语音识别基线
系统。第4部分论述r语音理解中的容错技术并且提出了三种瀑差尺度。第5部分给出了
实验和结果,最后进行了总结,
:、容铹算法耘述
容错算法的关键是如何衡量两字符串的差异。在摸式识别应用,咧如,手写体识别、语
音识别、信息提取和机器翻译中,我们常赢临比较文本类型、音索的问题。问题的核心是如
何度量字符串间的差异。在下面,我们将介绍三种尺度以比较字符串的差异。并殴计了一递
归算法用来实现这些尺度。
LevenshteinDistance(Gl由)j
1.广义Levenshtein距离(Generalized
广义Levensbtein距离是为了将一字符串转变为另一字符串所需的与捕入、删除和替换
操作相对应的编辑距离之和的最小值。首先,让我们对它进行公式化.设A是被考虑的字
237
第六届全国青年通信学术会议论文集
母表,A。为基于A均字符串集.九暮A是空符号.字符串S=s】s2…sN的长度为lSI=N,
其中,sEA’并且s,EAS.代表字符串S的前i个字符(1≤i≤N)
您可能关注的文档
最近下载
- 最新:2024湖北省医疗服务价格项目及医保支付目录(完整版) .pdf VIP
- 高标准农田建设项目 投标方案(技术方案).doc
- 【桂科版】《综合实践活动》五下 第6课《购物的学问有趣的购物体验》课件.pptx VIP
- 深刻领会二十届三中全会精神,进一步全面深化改革-2025执业药师继续教育答案.docx VIP
- m埋地钢管结构计算1.0.xls VIP
- VTE相关知识培训课件.pptx VIP
- 2025年 河南统招专升本 公共英语 真题及参考答案.pdf VIP
- 《肿瘤治疗相关心功能不全防治与管理专家共识》解读(2)(1).pptx VIP
- 为爱痴狂 钢琴独奏版 钢琴谱五线谱.pdf VIP
- 机床夹具拆装与调整实验实验报告模板.pdf VIP
原创力文档


文档评论(0)