第2章 语音信号常见特点的提取.pptxVIP

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 语音信号常见特点的提取

第2章 语音信号常见特征提取;2.1 短时能量及平均幅度分析;决定短时能量特性有两个条件:不同的窗口的形状及长度。 ;海明窗:;N=51的直角窗及海明窗的对数幅频特性。海明窗的第一个零值频率位置比直角窗要大1倍左右,同时其带外衰减也比直角窗大得多。;这里窗长的选择对于反映语音信号的幅度变化起着决定的作用。如果很大,它等效于很窄的低通滤波器,此时随时间的变化很小,不能反映语音信号的幅度变化,信号的变化细节就看不出来;反之,窗长太小时,滤波器的通带变宽,随时间有急剧的变化,不能得到平滑的能量函数。 ;Example;;2、短时平均幅度分析;短时平均能量及短时平均幅度的主要用途: ;2.2 短时过零分析;语音信号短时过零分析;鼻磋峪绰哼燃命姥纹畔奋世过鞘挪拢素腆调音玉肋烙从批抬睦糖侮孽距楔第2章 语音信号常见特征的提取第2章 语音信号常见特征的提取;;短时过零分析的意义:;无声:S 清音:U 浊音:V;2.3 短时相关分析;;;短时自相关函数:;如果定义:;短时自相关分析在语音识别中可有下面两个方面的应用: 用来区分清音及浊音,因为浊音信号是准周期性的,对浊音语音可以用自相关函数求出语音波形序列的基音周期; 另外在进行语音信号的线性预测分析时,也要用到短时自相关函数。;N=401时对8kHz取样的语音计算得到的图,计算滞后k大于0而小于250时的自相关值。前两种情况是对浊音语音段,第三种情况是对清音语音段。 ;修正的短时自相关函数:;;修正的自相关函数;2.4 短时平均幅度差函数   ;N=401时对8kHz取样的语音计算得到的图,计算滞后k大于0而小于250时的短时平均幅度差值。前两种情况是对浊音语音段,第三种情况是对清音语音段。 ;;2.5 短时傅里叶变换;;2. 标准傅里叶的解释;根据功率谱的定义,短时功率谱及短时傅里叶变换之间的关系为:;短时傅里叶变换为另一种形式: ;窗口序列的作用 ;;N=500时海明窗与直角窗的浊音谱分析;N=50时海明窗与直角窗的浊音谱分析;短时傅里叶变换的滤波器解释:;湃滩所梭贯变牌博洁愧拔掂吨支氮琢琅慑塘芍象篮摄讯赠哥姜衰互鲍鬃同第2章 语音信号常见特征的提取第2章 语音信号常见特征的提取;端点检???: 端点检测是指从包含语音的一段信号中确定出语音的开始及终止点。有效的端点检测不仅能使处理时间减到最小,而且能去除无声段的噪声干扰,从而使识别系统具有良好的识别性能。 一个较好的端点检测算法应该能够满足: 门限值可以对背景噪声的变化有一定的适应; 能够将短时冲激噪声和超过门限值的信号纳入无声段而不是有声段; 对于爆破音的寂静段,应将其纳入语音的范围而不是无声段; 应该尽量避免在检测中丢失鼻韵和弱摩擦音等与噪声特性相似、短时参数较少的语音; ;端点检测方法分类: 基于阀值的方法: 提取每一帧语音信号的声学特征,然后把这些特征的幅值与设定的阀值进行比较,从而对每一语音帧进行分类; 模式识别的方法: 需要估计语音及噪声信号的模型参数,检测过程和识别过程类似。 由于基于阀值的方法具有简单、快速的优点,从而被广泛研究和使用,但在噪声环境下该方法检测效果会变得很差。 基于模式识别的方法具有准确性好、稳健性较强的特点,但缺点是此类方法的复杂度高,运算量大,很难应用到实时语音编码系统中。;传统的端点检测算法;2、低频能量 基本原理:语音中的浊音信号具有能量集中在低频部分的特征,根据这一特点,改进短时能量阀值可以得到低频能量,判断浊音信号,效果较好。;低频能量的判别公式为: ;3.双门限前端检测法;3.基于噪声动态检测的语音端点检测算法;仿真实验及结果分析;4. 基于小波变换的语音端点检测算法;步骤: 1) 先将语音信号分成由1024个采样点组成的帧; 2) 对每帧进行10层小波分解; 3) 计算所选两个子带(子带4及子带5)的小波系数; 4) 计算两个子带的互相关系数; 5) 通过帧间平滑连接所有互相关系数成为一个和原信号长度相同的序列; 6) 计算序列前220个点(20ms)的最大值,把此最大值作为阈值; 7) 比较序列中各个点的值。若小于阈值,则记为静音;若大于阈值,则记为语音; 8) 按照上述过程对语音信号进行标记,再滤掉个别误判点,完成语音信号的端点检测。;5. 基于循环神经网络的语音端点检测算法 ;;3)仿真实验与结果分析 ;实验室背景下基于能量及过零率的端点检测结果 ;信噪比15dB时基于能量及过零率的检测结果 ;信噪比15dB时基于小波变换的端点检测结果 ;信噪比5dB时基于小波变换的端点检测结果;信噪比5dB时基于循环神经网络小波变换的端点检测结果 ;; 基于能量及过零

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档