- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号特征提取
语音信号的特征参数提取 演讲者:刘德体 特征提取的定义 特征参数的选择标准 LPC参数 LPCC参数及其差分 MFCC参数及其差分 方法比较 特征提取的定义 语音特征提取 特征提取就是从说话人的语音信号中提取出表示说话人个性的基本特征。 常见的说话人特征 语音帧能量、基音周期、线性预测系数LPC、共振峰频率及带宽、鼻音联合特征、谱相关特征、相对发音速率特征、LPC倒谱以及音调轮廓特征等。 本次主要讲的是线性预测倒谱系数(LPCC)及其差分和美尔倒谱系数(MFCC)及其差分作为说话人识别的特征参数。 特征参数的选择标准 体现对异音字之间的距离尽可能大,而同音字之间的距离应尽可能小。若以前者距离与后者距离之比为优化准则确定目标量,则应是该量最大; 各阶参数之间有良好的独立性; 特征参数要计算方便,最好有高效的计算方法,以保证语音识别的实时实现; 还要考虑特征参数的计算量,应在保持高识别率的情况下,尽可能减少特征维数,以减小存储要求和利于实时实现。 LPC参数 基本思想 语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即语音信号的每个取样值,可以用它过去若干个取样值的加权和来逼近。 用公式表示如下: 其中, 为语音信号的现在估计值, 为前p个采样值, 为预测系数。 系统的预测误差 : 为了使这种预测达到最佳,应使预测误差 在某一短时的总能量尽可能小,并在此准则下求出最佳预测系数 ,为此定义短时平均预测误差能量 为最小,即: 为了使 最小,上式对各阶LPC系数求导,并令其导数为零,即: 为此便得到以 为变量的线性方程组,一旦解出其中的变量 ,最小误差能量便可求得,设求出的最小误差能量解为: 则采用Yule-Walker求解线性预测系数的公式为:其中 : LPC的计算方法有自相关法、协方差法、格型法、Burg法等等。 LPC模型阶数P的确定 实验表明,LPC分析阶数p应选在8至12之间。选择p=12可以对绝大多数语音信号的声道模型取得足够近似的逼近。p值选得过大虽然可以略微改善逼近效果,但也带来一些负作用。一方面是加大了计算量,另一方面有可能增添一些不必要的细节,比如在用声道模型谱进行共振峰分析时反而使效果变坏。 LPCC参数及其差分 同态处理基本原理 语音信号、图像信号、通信中的衰落信号和调制信号都是非线性信号,是乘积性信号或卷积性信号。同态信号处理就是将非线性问题转化为线性问题来处理。图1是同台系统的组成框图。 复倒谱和倒谱 我们把前面得到的输出信号 称为输入信号 的复倒谱,用公式表示如下: 而倒谱c(n)定义为序列x(n)对数幅度谱的傅立叶逆变换,即: 线性预测倒谱 假若一个语音信号用一个p阶的全极点系统受白噪声u(n)激励产生的输出来模拟(也就是说该信号在零状态下只有白噪声作为激励),则输入和输出的关系可以表示为差分方程: 其中,G为增益系数,它用来控制音量。则该系统的Z域表达式: 该系统的传递函数:其冲激响应为 。求 的倒谱 ,根据同态处理方法有:因为线性预测中声道系统函数H(z)是最小相位的。即在单位圆内是解析的。所以 可以展开为级数形式为: 将 对 求导,并整理得:另上式两端 各次幂的系数相等,得到递推关系:按上式可以直接从预测系数推得倒谱,这个倒谱是根据线性预测模型得到的,所以称为线性预测倒谱(LPCC)。 线性预测差分倒谱 标准的LPCC参数只反映了声道参数的静态特性,反映说话人声道动态变化的参数就是线性预测差分倒谱。 线性预测差分倒谱的定义为: 这里k为常数,通常取2,这时差分参数就称为当前帧的前两帧和后两帧参数的线性组合。由此式计算得到的差分参数为一阶差分参数,用同样的公式对一阶差分参数进行计算,可得到二阶差分LPCC参数。 MFCC参数及其差分 MFC
您可能关注的文档
最近下载
- 《解析几何》教案--吕林根,许子道.pdf
- 美国加州桥梁抗震caltrans seismic design criteria vlysis.pdf VIP
- 2025云南省临沧市市级单位公开遴选(选调)工作71人笔试参考题库附答案解析.docx VIP
- HSE保障措施优化及实施方案研究.docx VIP
- 2025甘肃省公路交通建设集团武仙公路收费运营人员招聘61人笔试模拟试题及答案解析.docx VIP
- 2025年秋新鲁科版英语四年级上册全册课件.pptx
- 颚式破碎机技术参数.docx VIP
- 2024河南资本集团“方舟”第三批招聘41人笔试参考题库附带答案详解.pdf
- 《时尚配饰设计》课件.ppt VIP
- 高边坡专家论证PPT汇报材料(中建).ppt VIP
文档评论(0)