第三章音频信号的数字化及特征分析.pptVIP

第三章音频信号的数字化及特征分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章音频信号的数字化及特征分析

语音技术及其应用 第三章 音频信号的数字化及特征分析 洪青阳 副教授 厦门大学信息学院 Email: qyhong@xmu.edu.cn 本章内容 音频信号的数字化 音频信号的时域分析 音频信号的频域分析 音频信号的时频域分析 音频信号的倒谱分析 3.1 音频信号的数字化 音频信号的采样与量化 短时加窗处理 3.1 音频信号的数字化 将模拟音频信号转换成有限数字表示的离散序列 3.1.1 音频信号的采样与量化 所谓采样,就是把模拟信号在时间域上进行等间隔取样,其中两个取样点之间的间隔称为采样周期,它的倒数称为采样频率。 根据采样定理,当采样频率大于信号最高频率的两倍时,在采样过程中就不会丢失信息,并且可以用采样后的信号重构原始信号。 3.1.1 音频信号的采样与量化 3.1.1 音频信号的采样与量化 量化过程。 量化过程是指将每个采样值在幅度上再进行离散化处理。 量化会引入失真, 并且量化失真是一种不可逆失真, 这就是通常所说的量化噪声。 3.1.1 音频信号的采样与量化 量化方法 标量量化 均匀量化 非均匀量化 矢量量化 量化误差 信噪比(signal-to-noise ratio,SNR) 3.1.2 短时加窗处理 经过数字化的音频信号实际上是一个时变信号,为了能用传统的方法对音频信号进行分析,假设音频信号在几十毫秒的短时间内是平稳的。 为了得到短时的音频信号,要对音频信号进行加窗操作。窗函数平滑地在音频信号上滑动,将音频信号分成帧。分帧可以连续,也可以采用交叠分段的方法,交叠部分称为帧移,一般为窗长的一半。 3.1.2 短时加窗处理 在加窗的时候,不同的窗口选择将影响到音频信号分析的结果。在选择窗函数时,一般有两个问题要考虑。第一个问题是窗口的形状,即窗函数的形式。第二个问题是窗口的长度。 3.1.2 短时加窗处理 3.1.2 短时加窗处理 3.1.2 短时加窗处理 窗长N对能否反映语音信号的幅度变化起决定性作用。 若N很大,等效为带宽很窄的低通滤波器, 反映波形细节的高频部分被阻碍,短时能量很小。 若N很小,等效为带宽很宽的低通滤波器, 短时能量变化很剧烈,不能得到语音信号的平滑能量函数。 3.2 音频信号的时域分析 短时能量分析 短时平均过零率 短时自相关函数和短时平均幅度差函数 3.2.1 短时能量分析 3.2.1 短时能量分析 3.2.1 短时能量分析 3.2.2 短时平均过零率 过零就是信号通过零值。 对于离散信号,相邻的取样值改变符号则称为过零。 过零率就是样本改变符号的次数。 单位时间内的过零数为平均过零率。 3.2.2 短时平均过零率 语音信号x(n)的短时平均过零数定义为 3.2.2 短时平均过零率 用于语音信号分析 清音和浊音的过零分布是不同的: 清音具有较高的过零数,而浊音则具有较低的过零数。 用于从背景中找出语音信号 3.2.3 短时自相关函数和短时平均幅度差函数 相关函数用于测定两个信号在时域内的相似性。 互相关函数可测定两个信号间的时间滞后。 若两个信号波形完全不同,则互相关函数为零; 若两个信号波形相同,则在超前、滞后处出现峰值。 自相关函数用于研究信号本身。 3.2.3 短时自相关函数和短时平均幅度差函数 对于离散的音频信号x(n),它的自相关函数定义如下 短时自相关函数是在前面自相关函数的基础上将信号加窗获得的。 3.2.3 短时自相关函数和短时平均幅度差函数 3.2.3 短时自相关函数和短时平均幅度差函数 3.2.3 短时自相关函数和短时平均幅度差函数 短时自相关函数运算量比较大,因主要是乘法运算。而利用差值运算可避免该问题。 为了避免乘法运算,常常采用另一种与自相关函数有类似作用的参量,即短时平均幅度差函数。 3.2.3 短时自相关函数和短时平均幅度差函数 短时平均幅度差函数的定义为 3.3 音频信号的频域分析 对语音信号进行频谱分析是认识语音信号和处理语音信号的重要方法。 傅里叶变换 离散余弦变换 线性预测分析 3.3.1 傅里叶变换 标准傅里叶分析在信号处理中具有非常重要的作用。适用于周期、瞬变或平稳随机信号的分析。 语音信号是一个非平稳过程,所以标准傅里叶分析不能直接进行。因语音信号具有短时特性,所以可以采用短时傅里叶变换,即有限长度的傅里叶变换。相应的谱称为“短时谱”。 3.3.1 傅里叶变换 3.3.1 傅里叶变换 3.3.2 离散余弦变换 离散余弦变换(Discrete Cosine Transform, DCT)是与傅里叶变换相关的一种变换,类似于离散傅里叶变换,但是只使用了实数。 离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个是偶函数)

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档