网站大量收购独家精品文档,联系QQ:2885784924

基于MATLAB的语音信号的时、频域分析.doc

基于MATLAB的语音信号的时、频域分析.doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于MATLAB的语音信号的时、频域分析 摘要:MATLAB 语言是一种数据分析和处理功能十分强大的计算机应用软件 ,它可以将声音文件变换为离散的数据文件 , 然后利用其强大的矩阵运算能力处理数据 ,如数字滤波 、傅里叶变换 、时域和频域分析 、声音回放等。 本课程设计通过PC机录制自己的,运用M进行仿真分析,画出采样后语音信号的时域波形和频谱图,1. 语音信号的采集 1 2. 语音信号的时、频域分析 2 2.1 语音信号的时域分析 2 2.1.1 语音信号的时域波形 2 2.1.2 短时平均能量分析 3 2.2 语音信号的频域分析 6 3. 数字滤波器的设计 7 3.1 滤波器的设计选择 7 3.2 IIR数字滤波器的设计 8 3.3 对含噪语音信号进行滤波 10 4. 心得体会 10 参考文献 11 附 录 12 1. 语音信号的采集 为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。取样是将时间上连续的语音信号离散化为一个样本序列。根据取样定理,当取样频率大于信号的两倍带宽时,取样过程不会丢失信息,且从取样信号中可以精确地重构原始信号波形。 经过预滤波和采样后,由A/D变换器变换为二进制数字码。这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D变换、量化处理的离散的数字语音信号。 实际工作中,我们可以通过很多种方式录制语音信号,如手机、电脑、MP3、录音笔等,然后通过转换工具将音频格式转换为MATLAB可以识别的音频文件格式,这里的转换工具可以是千千静听或者其它的专用音频文件格式转换软件,可以获得任何我们想要的音频格式。本设计中我们利用windows自带的录音机录制语音文件,图1-1是基于PC机的语音信号录制过程,声卡可以完成语音波形的A/D转换,获得WAV文件,为后续的处理储备原材料。 声音 图1-1 基于PC机的语音信号录制过程 本设计分别在安静环境和噪杂环境下录制自己的一段语音,内容相同,均为“语音信号处理”,保存在MATLAB软件的工作目录下,分别命名为“xinhao.wav”和“zaosheng.wav” 2. 语音信号的时、频域分析 2.1 语音信号的时域分析 2.1.1 语音信号的时域波形 语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。 这种分析方法的特点是:①表示语音信号比较直观、物理意义明确。②实现起来比较简单、运算量少。③可以得到语音的一些重要的参数。④只使用示波器等通用设备,使用较为简单等。 MATLAB数据采集箱中提供的进行wavread?:wavread?用于读取扩展名为“.wav”的声音文件。其调用形式为:?y?=?wavread?()?。其作用是读取wave?文件将读取的采样数据送到y?中。sound:音频信号是以向量的形式表示声音采样的。sound?函数用于将向量转换为声音其调用形式为:sound?(y?,fs)?作用是向扬声器送出向量y?中的音频信号(采样频率为fs)?。w(n)。 在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,它们的表达式如下(其中N为帧长): 矩形窗: (2-1) 汉明窗: (2-2) 这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现:矩形窗的主瓣宽度小,具有较高的频率分辨率,旁瓣峰值大,会导致泄漏现象;汉明窗的主瓣宽8*pi/N,旁瓣峰值低,可以有效的克服泄漏现象,具有更平滑的低通特性因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。 由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为: (2-3) 其中N为窗长特殊地,当时,可简化为: (2-4) 本课程设计中录制的语音信号在矩形窗长N=400时的短时能量如下图2-2所示: 图2-2 N=400时的短时能量 短时平均能量的主要用途如下: ① 可以作为区分清音和浊音的特征参数。实验结果表明浊音的能量明显高于清音。通过设置一个能量门限值,可以大致判定浊音变为清音或者清音变为浊音的

您可能关注的文档

文档评论(0)

晓风迷梦 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档