实验1 语音信号的时域和频域分析全文阅读.pptxVIP

实验1 语音信号的时域和频域分析全文阅读.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验一 语音信号的时域和频域分析 一 、 实验目的 ¨ 理解和掌握语音信号的数字化和预处理方法。 ¨ 理解短时能量分析 、短时过零分析 、短时相关 分析。 ¨ 语音信号的短时傅立叶分析方法。 二 、 实验原理 ¨ 语音信号分析可分为时域 、 频域 、 倒谱域等方法。 ¨ 贯穿于语音分析全过程的是“短时分析技术 ”。 语音信号特性是随时间而变化的 , 是一个非平稳 的随机过程 。但从另一方面 , 在一个相对短时间范 围内其特性基本保持不变 。对于这种特点是语音信 号处理的一个重要出发点 。 因此我们可以采用平稳 过程的分析处理方法来处理语音。 时域分析 ¨ 时域分析是语音分析中最早使用 , 应用范围最 广的一种方法。 ¨ 特点: 1 、表示语音信号比较直观 。(语音信号本 身就是时域信号) 2 、 实现简单 、运算量小。 3 、可以得到语音的一些重要参数。 常用短时分析技术 ¨ 短时能量 ¨ 短时平均幅度 ¨ 短时过零率 ¨ 短时自相关函数 ¨ 短时平均幅度差函数 ¨ 短时频谱 ¨ 短时功率谱 短时能量分析 ¨ 能量分析是基于语音信号能量随时间有相当大 的变化 , 特别是清音段的能量一般比浊音段的 小得多。 ¨ 短时分析将语音流分为一段一段来处理 , 每一 段称为一“帧 ”。 ¨ 用有限长窗函数进行加权来实现。 不同的窗口选择(形状 、长度) , 将决定短时能量 的特性。 窗口的形状: 窗口有多种形状 , 他们都是中心对称 的。 窗口的长度: 无论什么形状的窗口 , 窗口序列的长 度N将起决定性的作用。 N太大 , 能量随时间变化很小 , 不能反映语音信号的 幅度变化 , 波形的变化细节就看不出来; N太小 , 滤波器的通带变宽 , 短时能量随时间有剧烈 变化 , 不能得到平滑的能量函数。 ¨ 窗口的选择(长度的确定) 又需相对不同的基 音周期来选择 。通常情况下 , 一个语音帧内应 含有1—7个基音周期 。然而不同的人其基音周 期变化范围很大 , 因此窗口宽度(N) 的选择 有一个折衷选择为100—200(即10—20ms持续 时间) 。 短时过零分析 ¨ 过零就是信号通过零值。 ¨ 考察连续语音信号其时域波形通过时间轴的情 况。 ¨ 通过相邻取值改变符号判断是否过零 , 从而计 算过零数。 ¨ 单位时间内的过零数称为平均过零数。 ¨ 对于窄带信号 , 平均过零数计算比较简单。 例: 有一频率为f0的正弦信号 , 以取样频率fs进 行取样 , 则每个正弦周期内有fs/f0个取样 , 另外, 每个正弦周期有二次过零 , 所以平均过零数为 借助平均过零数及取样频率可精确算出频率。 ¨ 对于语音信号序列是宽带信号 , 所以不能简单地用上 面的公式计算频率 。但是 , 可借助短时平均过零数来 得到其频谱的粗略估计。 ¨ 语音信号的短时平均过零数定义为 ¨ W (n)为窗口序列 , 其作用于短时平均能量一样。 是符号函数, ¨ 式子中 短时平均过零数的实现 ¨ 首先对语音信号序列进行成对采样地查对采样 以确定是否发生过零 , 若发生符号变化 , 则表 示有一次过零 , 而后进行一阶差分计算 , 再求 取绝对值 , 最后进行低通滤波。 例: 任选一段语音信号 , 对其进行采样 , 画出采 样以后的时域波形。 [x1,fs]=wavread ( c :\wang .wav ) ; %读取语音信 号 sound (x1,fs) ; %播放语音信号 plot(x1) %做原始语音信号的时域图形 title( 原始语音信号) ; xlabel ( time ) ; y label ( windows ) ; 绘制该语音信号短时平均能量 %读入声音文件 [x,fs]=wavread ( c :\wang .wav ) ; %常数设置 FrameLen = 240 ; FrameInc = 80 ; %计算短时能量 amp = sum (abs (enframe (filter ( [1 -0 .9375], 1, x) FrameLen, FrameInc)), 2) ; subplot (1,2, 1) ;plot (x) ;title ( 原波形图) subplot (1,2,2) ;plot (amp) ;title ( 短时平均能量图 当选择不同长度的窗时的短时能量 [x,fs]=wavread ( c :\wang .wav ) ; FrameLen 1 = 51 ; FrameLen2 = 101 ; FrameLen3 = 201 ; FrameLen4 = 401 ; FrameInc = 80

文档评论(0)

132****7021 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档