基于LPC倒谱的语音特征参数提取.docVIP

下载本文档

39
0
约7.51千字
约 3页
2019-10-23 发布于江西
举报
版权申诉

基于LPC倒谱的语音特征参数提取.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

文章编号: 1674-4578( 2012) 06-0015-02LPC基于倒谱的语音特征参数提取唐晓进( 国营大众机械厂，山西太原文章编号: 1674-4578( 2012) 06-0015-02 LPC 基于倒谱的语音特征参数提取唐晓进 ( 国营大众机械厂，山西太原 030024) 摘要: 语音识别指利用计算机识别语音信号所表达的内容，其目的是要准确地理解语音所蕴含的含义。本文着重研究了语音识别实现过程的特征提取，针对特征提取的多种方法，选用 LPC 倒谱系数作为特征参数提取，较彻底地去除了语音信号产生过程的激励信息，主要反映了声道模型，而且只需十几个倒谱系数就较好地描述了语音的共振峰特性。通过对语音信号进行预加重、分帧、加窗、自相关分析，而后提取出 LPC 倒谱系数。根据流程编写 VC 程序，对语音信号进行分析处理，去除对语音识别无关紧要的冗余信息，从而获得用于语音识别的重要信息。关键词: LPC; LPCC; 语音识别; 倒谱; 特征提取中图分类号: TN912． 34 文献标识码: A 语音信号按 Niquest 采样频率采样后，得到数字化表示的语音信号。由于采样率一般在 8kHz 以上，经数字化后的语音信号，数据量很大，不便于有效、实时地分析处理，故需从中提取对语音识别有用的信息。特征提取就是完成这项工作，它对语音信号进行分析处理，去除无关紧要的冗余信息，获得影响语音识别的重要信息。在特征提取的众多方法中，由于倒谱特征所包含的信息比其它参数多，能较好地表征语音信号，本文选用 LPC 倒谱系数( LPCC) 作为特征参数提取。线性预测倒谱系数( LPCC) 的提取依据语音信号产生的生理和数学模型可知，语音信号是 3 音源激励分量与声道冲激响应、辐射模型三者相乘的产物。因此通过语音信号的倒谱分析可有效地分离激励成分和声道成分。 3． 1 LPC 倒谱系数( LPCC) 计算语音信号的倒谱使用根据 AR 模型对 LPC 参数进行递推，形成 LPC 倒谱的方法。线性预测分析方法是一种谱估计的方法，而且其声道模型系统函数 H( z) 反映了声道的频率响应和原始信号的谱包络，因此用 lgH( z) 做反 Z 变语音识别基本原理语音识别本质上是一种模式识别的过程，其基本结构原理框图如图 1 所示，主要包括语音信号预处理、特征提取、特征建模、相似性度量和后处理等几个功能模块［1］。 1 ［3］换即可求出其 LPC 倒谱系数( LPCC) 。通过线性预测分析得到的声道模型为全极点模型，假设其系统函数为: 1 H( z) = ( 1) ． P 1 － Σ ak z － k k = 1 其中 p 为 LPC 线性预测器的阶数。设其冲激响应为 h( n) ，则: ∞ 图 1 语音识别基本原理图 2 特征参数的选择语音识别系统常用的特征参数有幅度、能量、过零率、线性预测系数 ( LPC ) 、LPC 倒谱系数 ( LPCC ) 、线谱对参数 ( LSP) 、短时频谱、共振峰频率、反映人耳听觉特征的 Mel 频率倒谱系数( MFCC) 等。语音识别一般是语音特征参数模式的识别和比较，因此特征参数的选择以及提取，对于语音识别系统至关重要，是系统构建的基础［2］。在语音识别问题中，选择语音特征参数的主要依据是: ( 1) 该特征能够充分正确地反映语音声道谱，以便识别模型中利用其特征。 ( 2) 语音特征维数达到有效地压缩，将语音帧信号维数降低至特征参数的维数，使后继处理方便、快捷。 ( 3) 特征参数的计算方法简便、高效，能在各种实时系统中实现。 H( z) = Σ h( n) z － n ． n = 1 ( 2) ∧ 需要求 h( n) 的复倒谱 h( n) ，根据复倒谱定义，有: ∞ ∧ ∧ H( z) = lgH( z) = Σ h( n) z － n ． ( 3) n = 1 将式( 1) 代入并将其两边对 z － 1 求偏导数，经变换后，可 ∧ ∧ 得到 h 和 a 之间的递推关系，从而由 a 求出 h( n) : k k ∧ h( 0) ∧ h( 1) = 0，( n ≤ 0) = a1 ? ? ? ? ? ? ? n －1 ． ( 4) ∧ h( n) ∧ = an + Σ ( 1 － k / n) ak h( n － k) ，( 1 ≤ n ≤ p) k = 1 p ∧ h( n) ∧ = Σ ( 1 － k / n) ak h( n － k) ，( n ＞ p) k = 1 收稿日期: 2012 － 10 － 08 作者简介: 唐晓进( 1970- ) ，男，山东昌邑人，工