第2节 语音信号常见特征的提取.ppt

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 语音信号常见特征提取 2.1 短时能量和平均幅度分析 原理:语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。 定义: Short time energy of words “Do you like it Do you like it” 2、短时平均幅度分析 定义: 框图: 优点: 1、对高电平信号不如En敏感; 2、计算方法简单。 缺点:浊音和清音的区分不如En明显。 短时平均能量和短时平均幅度的主要用途: 可以区分清音段与浊音段:En值大的对应于浊音段,而En值小的对应于清音段。En值的变化,可大致判定浊音变为清音或清音变为浊音的时刻。 可以用来区分声母与韵母的分界,无声与有声的分界,连字(指字之间无间隙)的分界等。 作为一种超音段信息,用于语音识别中。 2.2 短时过零分析 定义:过零就是信号通过零值。 连续语音信号,考察其时域波形通过时间轴的情况; 离散时间信号,相邻的取样值改变符号则称为过零。 语音信号序列是宽带信号, 则不能简单用上面的公式。 语音信号短时过零分析 定义: 短时过零分析的意义: 可以区分清音与浊音:浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。 利用它可以从背景噪声中找出语音信号,可用于判断寂静无语音和有语音的起点和终点位置。 在背景噪声较小时用平均能量识别较为有效,而在背景噪声较大时用平均过零数识别较为有效。 2.3 短时相关分析 互相关可测定两个信号间的时间滞后或从杂音中检测信号; 自相关用于研究信号本身,如信号波形的同步性、周期性等 。 2.5 短时傅里叶变换 2. 标准傅里叶的解释 短时傅里叶变换为另一种形式: 窗口序列的作用 短时傅里叶变换的滤波器解释: 传统的端点检测算法 3.双门限前端检测法    利用短时过零率来检测清音,用短时能量来检测浊音 。 双门限法是考虑到语音开始以后总会出现能量较大的浊音,设一个较高的门限用以确定语音已开始,再取一比稍低的门限,用以确定真正的起止点及结束点。判断清音与无话的差别,是采用另一个较低的门限,求越过该门限的“过零率”。只要取得合适,通常背景噪声的低门限过零率将明显低于语音的低门限过零率值。这种方法普遍地用于有话、无话鉴别或词语前端检测。 3.基于噪声动态检测的语音端点检测算法 仿真实验及结果分析 步骤: 1) 先将语音信号分成由1024个采样点组成的帧; 2) 对每帧进行10层小波分解; 3) 计算所选两个子带(子带4和子带5)的小波系数; 4) 计算两个子带的互相关系数; 5) 通过帧间平滑连接所有互相关系数成为一个和原信号长度相同的序列; 6) 计算序列前220个点(20ms)的最大值,把此最大值作为阈值; 7) 比较序列中各个点的值。若小于阈值,则记为静音;若大于阈值,则记为语音; 8) 按照上述过程对语音信号进行标记,再滤掉个别误判点,完成语音信号的端点检测。 5. 基于循环神经网络的语音端点检测算法 3)仿真实验与结果分析 2.6 语音信号的倒谱分析 同态信号处理的基本原理 信号分类:加性信号、乘积性信号、卷积性信号等。 同态信号处理目的:将非线性问题转化为线性问题来处理。 同态信号处理分类:乘积同态处理和卷积同态处理两种。 复倒谱和倒谱 语音信号的复倒谱 语音信号可看作是声门激励信号和声道冲激响应序列的卷积。 1 声门激励信号 2 声道冲激响应序列 结论: ① 是双边序列,存在于-∞n∞的范围内。 ② 是衰减序列, 随|n|的增大而减小。 ③ 随|n|增大而衰减的速度至少比1/|n|快, 避免相位卷绕 实例分析 特征系统 D* 反特征系统 D*-1:它是特征系统的反运算 卷积同态系统: 特征系统 D* 反特征系统 D*-1: 是一个时域序列,我们 称是x(n)的“复倒频谱”,简称为“复倒谱”,有时也称作对数复倒谱。 所处的离散时域,称之为“复倒谱域”。这样,特征系统D*[ ]将离散时域中的卷积运算转换为复倒谱域中的加性运算。进行同态信号处理后,即可完成解卷的任务。若时域中有 ,则复倒谱域中 。假设 位于复倒谱域中不同的间隔内并且互不交替,那么适当地设计线性系统,便可将x1(n)或x2(n)分离出来。 特征系统 D* 反特征系统D*-1 c(n)是序列x(n)对数幅度谱的傅里叶

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档