基于LPC倒谱的语音特征参数提取.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文章编号: 1674-4578( 2012) 06-0015-02LPC基于倒谱的语音特征参数提取唐晓进( 国营大众机械厂,山西 太原 文章编号: 1674-4578( 2012) 06-0015-02 LPC 基于 倒谱的语音特征参数提取 唐晓进 ( 国营大众机械厂,山西 太原 030024) 摘 要: 语音识别指利用计算机识别语音信号所表达的内容,其目的是要准确地理解语音所蕴含的含义。本 文着重研究了语音识别实现过程的特征提取,针对特征提取的多种方法,选用 LPC 倒谱系数作为特征参数提取,较 彻底地去除了语音信号产生过程的激励信息,主要反映了声道模型,而且只需十几个倒谱系数就较好地描述了语 音的共振峰特性。通过对语音信号进行预加重、分帧、加窗、自相关分析,而后提取出 LPC 倒谱系数。根据流程编 写 VC 程序,对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,从而获得用于语音识别的重要信息。 关键词: LPC; LPCC; 语音识别; 倒谱; 特征提取 中图分类号: TN912. 34 文献标识码: A 语音信号按 Niquest 采样频率采样后,得到数字化表示 的语音信号。由于采样率一般在 8kHz 以上,经数字化后的 语音信号,数据量很大,不便于有效、实时地分析处理,故需从 中提取对语音识别有用的信息。特征提取就是完成这项工 作,它对语音信号进行分析处理,去除无关紧要的冗余信息, 获得影响语音识别的重要信息。在特征提取的众多方法中, 由于倒谱特征所包含的信息比其它参数多,能较好地表征语 音信号,本文选用 LPC 倒谱系数( LPCC) 作为特征参数提取。 线性预测倒谱系数( LPCC) 的提取 依据语音信号产生的生理和数学模型可知,语音信号是 3 音源激励分量与声道冲激响应、辐射模型三者相乘的产物。 因此通过语音信号的倒谱分析可有效地分离激励成分和声 道成分。 3. 1 LPC 倒谱系数( LPCC) 计算语音信号的倒谱使用根据 AR 模型对 LPC 参数进 行递推,形成 LPC 倒谱的方法。线性预测分析方法是一种 谱估计的方法,而且其声道模型系统函数 H( z) 反映了声道 的频率响应和原始信号的谱包络,因此用 lgH( z) 做反 Z 变 语音识别基本原理 语音识别本质上是一种模式识别的过程,其基本结构原 理框图如图 1 所示,主要包括语音信号预处理、特征提取、特 征建模、相似性度量和后处理等几个功能模块[1]。 1 [3] 换即可求出其 LPC 倒谱系数( LPCC) 。 通过线性预测分析得到的声道模型为全极点模型,假设 其系统函数为: 1 H( z) = ( 1) . P 1 - Σ ak z - k k = 1 其中 p 为 LPC 线性预测器的阶数。设其冲激响应为 h( n) ,则: ∞ 图 1 语音识别基本原理图 2 特征参数的选择 语音识别系统常用的特征参数有幅度、能量、过零率、线 性预测系 数 ( LPC ) 、LPC 倒 谱 系 数 ( LPCC ) 、线 谱 对 参 数 ( LSP) 、短时频谱、共振峰频率、反映人耳听觉特征的 Mel 频 率倒谱系数( MFCC) 等。语音识别一般是语音特征参数模 式的识别和比较,因此特征参数的选择以及提取,对于语音 识别系统至关重要,是系统构建的基础[2]。 在语音识别问题中,选择语音特征参数的主要依据是: ( 1) 该特征能够充分正确地反映语音声道谱,以便识别 模型中利用其特征。 ( 2) 语音特征维数达到有效地压缩,将语音帧信号维数 降低至特征参数的维数,使后继处理方便、快捷。 ( 3) 特征参数的计算方法简便、高效,能在各种实时系 统中实现。 H( z) = Σ h( n) z - n . n = 1 ( 2) ∧ 需要求 h( n) 的复倒谱 h( n) ,根据复倒谱定义,有: ∞ ∧ ∧ H( z) = lgH( z) = Σ h( n) z - n . ( 3) n = 1 将式( 1) 代入并将其两边对 z - 1 求偏导数,经变换后,可 ∧ ∧ 得到 h 和 a 之间的递推关系,从而由 a 求出 h( n) : k k ∧ h( 0) ∧ h( 1) = 0,( n ≤ 0) = a1 ? ? ? ? ? ? ? n -1 . ( 4) ∧ h( n) ∧ = an + Σ ( 1 - k / n) ak h( n - k) ,( 1 ≤ n ≤ p) k = 1 p ∧ h( n) ∧ = Σ ( 1 - k / n) ak h( n - k) ,( n > p) k = 1 收稿日期: 2012 - 10 - 08 作者简介: 唐晓进( 1970- ) ,男,山东昌邑人,工

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档