- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
語音信号处理
语音信号处理
院定选修课
学时:32
学分: 2
信号信息处理的重要研究方向
语音信号处理
QQ群:
郎文辉
电话:3419617
第一章 绪 论
研究对象
语音:语言的声学表现。由人的发音器官发出的、具有一定语法和意义的声音。
重要性:最重要、最有效、最常用、最方便的信息交换手段。“四会”
语音信号处理:用数字信号处理技术对语音信号进行处理。
新兴、综合性、交叉学科;涉及到语言学、声学、认知学、心理学。
信号与信息处理的重要组成部分
热门学科,存在大量机遇
研究内容包括:
语音编码-压缩
语音合成-计算机讲话读文章
语音识别-口授打字机等,翻译
关键词识别
语音增强
说话人识别-“声纹”身份识别。
教学内容与目标:
课程内容:
基本概念的建立;
各种理论和算法介绍。
教学目标:
对语音信号处理有基本了解,为以后的研究工作做储备。
发展概况:
39年的声码器用于通讯
40年代后期的语谱仪
60年代的数字模型:《语音产生的声学理论》
70年代的LPC
80年代的VQ以及HMM
90年代的神经元等新技术
第二章??语音信号处理的基础知识
2.1 概述
本章讨论内容
1、语音产生模型 线性模型
2、语音学基本内容
信息交流“发音-传递-感知”三个阶段
发音语音学 - 确定发音机理较成熟
声学语音学 - 信号分析理论解释语音现象
听觉语音学 - 认识感知的过程
2.2 语音产生的过程
语音是具有一
定意义的声音
20-20KHz。
经分析:
欲表达-
选择词、语句-
控制肌肉运动-
振动空气形成语音
波
声带是位于喉咙中间的两条白色韧带
等效为激励源+声道+喇叭口
声带开启和闭合使气流形成一系列脉冲。每开启和闭合一次的时间即振动周期称为音调周期或基音周期,其倒数称为基音频率,也简称为基频70-350Hz
声道是由咽、口腔和鼻腔组成,它是一根从声门延伸至口唇的非均匀截面的声管
等效为激励源+声道+喇叭口
激励源:声带
声带振动频率-基频(基音频率)
清音 - 声带不振动
浊音 - 声带振动
声道:可变谐振腔
不同形状、不同音
共振(谐振)频率
c为声速,L为声道长度,n为谐振频率的序号
分析认为,声道的谐振频率(设截面均匀):
共振峰
Fn的局部最大值,称为共振峰。与声道对应,反映语音的频率特性,是语音的主要特征之一。不同人不同,同一人发不同音时也不同。
第一共振峰F1
第二共振峰F2
第三共振峰F3
一般地:语音识别,取前3个共振峰,而对
语音合成,需取5个
频率范围(Hz)
成年男子
成年女子
带宽
F1
200~800
250~1000
40~70
F2
600~2800
700~3300
50~90
F3
1300~3400
1500~4000
60~180
2.3 语音信号的特性
2.3.1 语言和语音的基本特性
语言,特殊的声音,按一定规则排列
声音的物理属性
音质:基本特征
音调:频率
音强:量、响度、幅度
音长:声音的长短
语音特有的属性
音节:语音流的最小单位
音素:语音的最小单位,音素构成音节
感情:重音
语调
声调等
2.3.2 语音的时间波形和频谱特性
看一段实际语音
放大
结论1:时间的连续函数、频率幅度随时间变化是随机的
元音 其中一段再放大
结论2:短时间内近似认为不变
结论3:元音是准周期函数(基频)
基音周期
清音
结论4:清音为随机起伏
2.3.3 语音信号的统计特性
平稳随机过程:随机信号的统计特性与开始进行统计分析的时刻无关。
各态遍历的随机过程:如果所有样本在固定时刻的统计特征和单一样本在全时间上的统计特征一致。
语音信号可以看作是一个遍历性随机过程的样本函数。对语音信号进行周期性取样得到的取样序列可以看成是离散时间过程的取样序列。
语音信号的统计特性:用振幅概率密度函数和一些平均量(主要是均值和自相关函数)来描述。
概率密度的估算:根据长时间范围内一段语音信号的大量取样数据的绝对值计算其直方图。
修正伽玛密度(实线)、拉普拉所密度(虚线)相向斯密度(点线)以及天气预报语音的长期幅度分布(不规则的虚线)
2.4 语音信号产生的数字模型
理想模型标准
准确 但不可能,必近似、简化
简单 最好用成熟的理论
线性模型
线性系统
语音信号
脉冲序列
脉冲序列 - 激励源,线性系统 - 声道+喇叭口
激励源 - 周期序列(浊音)/随机序列(清音)
线性系统 - 短时内不变
一个实用模型
P16 图2-12
激励模型 声道模型 辐射模型
小结
语音的时间波形
连续、随
原创力文档


文档评论(0)