数字语音信号处理实验报告.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理实验报告专业班级电子信息1203学生姓名钟英爽指导教师覃爱娜完成日期2015年4月28日电子信息工程系信息科学与工程学院实验一 语音波形文件的分析和读取实验学时:2 学时 二、实验的任务、性质与目的: 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验 (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 三、实验原理和步骤:WAV 文件格式简介 WAV 文件是多媒体中使用了声波文件的格式之一,它是以 RIFF格式为标准。每个 WAV 文件的头四个字节就是“RIFF” 。WAV 文件由文件头和数据体两大部分组成, 其中文件头又分为 RIFF/WAV 文件标识段和声音数据格式说明段两部分。 常见的 WAV 声音文件有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)和双声道(44.1KHz 采样率、16Bit 的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8 位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个 16 位的整数(int),高八位和低八位分别代表左右两个声道。WAV 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道 WAV 文件中,道 0 代表左声道,声道 1 代表右声道;在多声道 WAV 文件中,样本是交替出现的。WAV 文件的格式表 1 wav文件格式说明表 偏移地址 字节数数据类型 内 容文件头00H4charRIFF标志04H4long int文件长度08H4charWAVE标志0CH4charfmt标志10H4过渡字节(不定)14H2int格式类别(10H为 PCM 形式的声音数据)16H2int通道数,单声道为 1,双声道为 218H2int采样率(每秒样本数),表示每个通道的播放速度1CH4long int波形音频数据传送速率,其值为通道数×每秒数据位数×每样本的数据位数/8。 播放软件利用此值可以估计缓冲区的大小。20H2int数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。 播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。22H2每样本的数据位数, 表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。24H4char数据标记符"data"28H4long int语音数据的长度 (1)选取 WINDOWS 下 MEDIA 中的任一 WAV 文件,采用播放器进行播放,观察其播放波形,定性描述其特征; (2)录入并存储本人姓名语音文件(姓名.wav),根据 WAV 文件的储格式,利用 MATLAB 或 C 语言,分析并读取文件头和数据信息;(3)将文件的通道数、采样频率、样本位数和第一个数据读取并示出来。 四、实验设备 PC机。 五、实验源程序及结果: [y,Fs,bits]=wavread(C:\Users\Administrator\Desktop\zys.wav);//读取本人姓名语音文件,分析并读取文件头和数据信息,y为数据信息、Fs为采样频率、bits为样本位数m=wavread(C:\Users\Administrator\Desktop\zys.wav,1); 将文件的第一个数据读取并示出来实验二 语音信号的时域参量分析 实验学时:2 学时 二、实验的任务、性质与目的: (1)增强学生对语音时域分析理论的理解,尤其是语音的短时能量、幅度和过零率的的分析和应用; (2)进一步提高学生分析问题和解决问题的能力从而培养学生初步掌握进行科学研究的方法和总结实验结果的能力。三、实验原理和步骤: (1)利用MATLAB或C语言,针对ringout.wav文件,求取语音信号的短时能量函数、短时平均幅度函数和短时平均过零率三大时域参量; 三大时域参量的定义式是: 短时能量函数和短时平均幅度函数(2)将三大时域参量的结果用波形图的方式显示出来; (3)分析并标识波形图上的清浊音信息。四、实验设备PC机。五、实验源程序及结果[y,Fs,bits]=wavread(C:\Users\Administrator\Desktop\ringout.wav);T=1/Fs;N=input(窗口长度为:);h=linspace(1,1,N);En=conv(h,y.*y);subplot(4,1,1),plot(y)subplot(4,1,2),plot(

文档评论(0)

dashewan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档