- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理 课程考核方式 闭卷、笔试。 成绩评定方式: 考试成绩占80% ,实验成绩占10% ,平时成绩占10%。 教材 参考书 韩纪庆,张磊,郑铁然.语音信号处理. 北京:清华大学出版社.2004 赵力.语音信号处理.北京:机械工业出版社,2003 课程安排 第一章 语音信号处理的基础知识 第二章 语音信号分析 第三章 矢量量化技术 第四章 隐马尔可夫模型 第五章 语音编码 第六章 语音合成 第七章 语音识别 第八章 语音增强 第一章 语音信号处理的基础知识 1.1 数字语音处理研究的内容 1.2 语音文件格式 1.3 人类的语言器官 1.4 语音产生过程 1.5 语音信号产生的数学模型 声音: 语音和非语音 语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,是人类进行思维的依托。 人的言语过程 语音信息的重要性 人类从大自然获取信息的分布图 一.语音信号处理的实质 1 实质:是研究利用数字信号处理技术对语音信号进行处理的一门学科 2 目的:通过处理得到一些反映语音信号重要特征的语音参数以便高效地传输或储存语音信号所包含的信息。通过对语音信号进行某种运算以达到某种要求。 3 学科基础:以语音语言学和数字信号处理为基础而形成的一门涉及面很广的学科,与心理学、生理学、计算机科学、通信与信息科学、模式识别和人工智能等学科均有密切的关系 二. 语音信号的数字处理方法 1 语音信号的特点—短时平稳性 2 短时时域处理方法—短时能量、短时平均过零 率以及短时自相关函数计算 3 短时频域分析—短时傅立叶分析 4 线性预测技术—本质上属于时域分析方法,但其 结果可以是频域参数 5 倒谱和同态分析、矢量量化和隐马尔可夫模型 语音信号的特点—短时平稳性 1.2 语音文件格式 计算机中最常见的存放声音格式就是WAV(WAVEFORM)文件格式,其扩展名是 .wav。 WAVE文件作为最经典的Windows多媒体音频格式,它使用三个参数来表示声音:采样位数、采样频率和声道数。 声道有单声道和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三种。 WAVE文件所占容量=(采样频率×采样位数×声道)×时间/8(1字节=8bit)。 二.语音文件格式之WAV格式 WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF (resource interchange file format)(资源互换文件格 )格式为标准的,WAV文件是以RIFF 的档案格式储存,每个WAVE文件的头四个字节便是“RIFF”。 RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由辨别码、数据大小及数据所组成。 辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。 Window目前仅提供WAVE_FORMAT_PCM一种数据格式 二.语音文件格式之WAV格式 ③Data Chunk ?????????? |????????????? |所占字节数|???????? 具体内容??????????????? =========================?????????? | ID?????????? |???????? 4 Bytes |????????? data??????????????? ----------------------------------?????????? | Size???????? |???????4 Bytes |???????????????????????? ----------------------------------?????????? | data???????? |???????????????? |???????????????????????? ---------------------------------- Data Chunk是真正保存wav数据的地方,以data作为该Chunk的标示。然后是数据的大小。紧接着就是wav数据。根据Format Chunk中的声道数以及采样bit数,wav数据的bit位置可以分成以下几种形式: ???? 单声道???? |?????????? 取样1?????????? |?????????? 取样2?????????? |?????????? 取样3?????????? |??????
文档评论(0)