GSM语音识别.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GSM语音识别.doc

基于GSM编码的语音识别系统 信息与通信工程学院 电子09-3 王海康 译 指导教师:杨亚宁 摘要:语音编码与识别精度对语音识别的性能有重要影响。几乎所有能识别编码的系统都是先输入编码参数,然后执行确认(在噪声或信道补偿后),这是语音识别使用的常规步骤。在本文中,我们非常认可语音编码的准确度得益于语音识别精度使用倒频谱所获得的参数。在这里,我们使用13-kbps的GSM全速率编解码器。GSM编解码器具备线性预测(LPC)滤波器和残差信号的编码声音组件。我们进行量化和编码,测量所得参数准确表示,通过选择性地组合倒频谱代表的LPC参数和残差信号的流是能够准确得到等于或超过识别精度的波形。 关键词:GSM编码;语音识别;全速率 1 简介 语音编码会影响语音识别的准确性,可以使编码比特率降低。语音通信应用程序使用的增加编码算法和语音通信的相互作用,让这些系统的自动语音识别应用程序进行语音编码,限制应用的性能,就成为一个严重的问题。我们处理这个问题的方法有不少。这些方法涉及再生的信号补偿和适应技术的应用。识别准确率较大时,用于识别的语音不能经过相同的编码过程(即“不匹配条件”)。 然而,使用同样编码的语音准确率降低,也并不能消除识别的障碍。 我们认为使用13-kbps的GSM全速率编解码器,可以提高语音编码的准确性和对语音识别的精度。 GSM是一个正脉冲激励(RPE-LTP)的编码过程。我们假设,对语音识别系统访问发送GSM编码语音信号的参数,我们可以从结果分析出有损压缩和量化的影响来自量化面积比率(LAR),及RPE-LTP参数重构残差信号。我们通过比较发现,它们是衍生的逆谱未编码和未量化这些信号的版本。 我们将证明,量化和编码影响着LPC滤波器和造成不同量的残余激励信号。我们经过分析LPC滤波器和所述残余信号,尽量减少了语音识别的错误率。 我们在第2节会简要地讨论一下GSM编解码器的特点。我们在第3节将讨论GSM编码和量化的效果和特征。在第4节中,我们讨论提取系数的方法及简述倒谱特征,以最大限度地减少GSM编码声音信号识别错误率。 2 全速率——GSM语音编解码器 GSM全速率语音编解码器是一个在有损语音的基础上有规律的激发脉冲的算法。 GSM转换成13位数字信号的采样是从8 kHz开始的。因此,GSM编码产生一个总比特率为13.0 kbps的算法,实际的GSM传输比特率是由于添加了较高的错误恢复和数据包信息。 RPE-LTP编码算法是由线性预测合成(LPAS)家族的编码算法[4]。 在有LPAS算法的情况下,GSM编解码器表示的语音信号使用了两个参数集:信息LPC滤波器(量化的面积比的形式,Q-LARS)和残差信号的编码信息(形式量化的RPE-LTP参数)。压缩的残差信号是在一个有损的过程中引入失真成的残差信号。在解码过程中,所述残差信号是第一重建的RPE-LTP信息,然后由短期合成滤波器过滤,最后导出参数。 在特定情况下的全速率GSM的差异最小化用实际残差信号和所述重构的残差信号计算这种差异的量化的RPE-LTP来表示。除了表示的残余信号,该算法还介绍了RPE-LTP部量化的LAR系数在讲话中受到退化起到了重要作用,表明其已经经历了GSM编码过程。 3 参数量化的影响和编码的逆谱 在本节中,我们描述了用于开发程序倒谱信号和开发的GSM语音编码的语音识别功能。我们认为,矢量直接从重构衍生GSM语音信号,矢量来自面积比率代表LPC滤波器和来源于残差向量信号。我们比较这些逆谱与未编码非量化的信号参数,确定版本在何种程度上编码和量化影响准确度。最后,我们比较,在语音识别系统中获得。 大多数识别系统直接操作的语音波形以常规的方式,从GSM参数解码。GSM的解码信号和原始信号之间的语音波形差异可能会导致语音识别劣化。GSM编码影响的各种倒谱系数代表不同比例的解码讲话。在图中,我们绘制的归一化平均平方误差(NMSE)对应GSM解码语音的系数倒频谱矢量(平均平方误差归一由一个给定的系数的平均平方值)。如果我们考虑失真的影响,加性噪声信号,NMSE是大成比例的信号的逆噪声比(SNR)。可以看出,在图中,归一化均方误差由GSM编码引入一般作为系数增加指数。倒频谱系数,也能够获得量化的面积比(LAR)参数,这些参数的过程中开发GSM编码。LAR参数被转化成相应的LPC系数。 GSM标准规定,使用生成的8个系数八阶LPC分析。归一化平均平方误差(NMSE)的逆谱GSM重建语音波形逆谱的原始波形为标准。LPC分析开发的倒频谱系数的归一化均方误差GSM的编码语音信号被绘制在图中。 GSM编码的效果一般。这些系数似乎代表原始波形中的系数归一化均方误差NMSE一般随着系数顺序增加。 归一化均

文档评论(0)

000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档