- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字音频实验 5 音频特征提取
一、 实验目的
加深对数字音频特征的理解,了解短时能量与短时平均过零率的作用及求法。
二、 实验设计
编写一个求音频文件短时能量和过零率的应用程序。
具体程序要求:
音频文件为根目录下的 test_exp5_1.wav 的 16 位采样位数的文件;
计算所得的短时能量是一个相对值,即对每个数据与最大值的相对值进行加权运算;
将结果输出至文件。
三、 基本理论
1. 短时能量
音频信号的能量随着时间变化比较明显,其短时能量分析给出了反映这些幅度变化的一
个合适的方法。对于信号{x(n)},其短时能量的定义如下:
∞ ∞
En ∑[x (m)w(n −m)]2 ∑x 2 (m)h(n −m) x 2 (n) ∗h(n)
m −∞ m −∞
其中,h(n) w2 (n) ,表示在信号的第 n 个点开始加窗函数时的短时能量。如果用x w (n) 表
n+N −1
示x (n) 经过加窗处理后的信号,窗函数的长度为 N,短时能量可表示为E ∑x 2 (m) ,
n w
m n
n+N −1
所以如果所加窗为矩形窗,短时能量为En ∑x 2 (m) 。
m n
短时能量可以有效地判断信号幅度的大小,并可用于有声/无声的判定,这对音频信号
的检测非常重要。
2. 短时平均过零率
短时平均过零率是音频信号时域分析中最简单的一种特征。顾名思义,它是指每帧内信
号通过零值的次数,它在一定程度上可反映频率信息,进而得到频谱特性,通过短时平均过
零率可获得谱特性的一种粗略估计。计算短时平均过零率的公式为:
∞ + −1
1 1 n N
Z n ∑ sgn[x (m)] −sgn[x (m −1)] ∑sgn[x w (m)] −sgn[x w (m −1)]
2 2
m −∞ m n
其中,sgn[•] 是符号函数,即
⎧1 x (n) ≥0
sgn[x (n)] ⎨
−1 x (n) 0
⎩
四、思考题
1. 8 位数据与 16 位数据文件在求短时平均过零率时有何不同?
2. 怎样通过短时平均过零率粗略估计信号频率?
五、 编程指导
1. 数据表示与存储
帧处理类——CAFrame
class CAFrame
{
public:
unsigned int nFrameSize; // 每帧采样点数
float* frame; //存储每帧采样值
float st_energy; //短时能量
float zcr;//过零率
public:
CAFrame()
文档评论(0)