- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语音信号处理是研究数字信号处理技术对语音信号进行处理的一门科学
语音:是声音和语言的结合体,是一连串的音组成的语言的声音。
人的说话过程:想说,说出,传送,接收,理解。
句法的最小单位是单词,词法的最小单位是音节。
语音特征:音色,音调,音强,音长。
语音音素:元音和辅音。辅音包括浊音(声带振动)和清音
共振峰:元音激励进入声道时引起共振特性,产生一组共振频率。
基音频率:浊音的声带振动的基本频率。
汉语是一种声调语言,声调具有辩义作用。
声调的变化就是浊音基音周期的变化。
汉语音节的一般结构:声带,韵母,声调
对发音影响最大的是声带。
基音周期:声带每开启和闭合一次的时间,倒数就是基音频率。
语音听觉系统:耳:内耳(将机械信号转化为神经信号),中耳(声阻抗变换),外耳(声源
定位和声音放大)。
掩蔽效应:在一个强信号附近,弱信号将变得不可闻。被掩蔽掉的不可闻信号的最大声压级
称为掩蔽门限或掩蔽阈值。
掩蔽效应:同时掩蔽和短时掩蔽。同时掩蔽:存在一个弱信号和一个强信号频率接近,强信
号会提高弱信号的听阀,当弱信号的听阀被升高到一定程度就会导致这个弱信号弱不可闻。
短时掩蔽:当A声和B声不同时存在时也存在掩蔽作用,称为短时掩蔽。
语音信号生成的数学模型:激励模型(一般分为浊音激励和清音激励),声道模型(一般分
为声管模型和共振峰模型,共振峰模型又分为三种:级联,并联,混合型),辐射模型。
浊音激励模拟成是一个以基音周期为周期的斜三角脉冲串。可以把清音模拟成随机白噪声。
完整的语音信号的数学模型的传输函数H(z)=AU(z)V(z)R(z).一阶高通形式的R(z)=R0(1-z^(-1))
把和时序相关的傅里叶分析的显示图形称为语谱图。语谱图是一种三维频谱,它是表示语音
频谱随时间变化的图形。
第三章:语音信号分析
1.参数性质不同:时域,频域,倒频域。分析方法:模型分析法(根据语音信号产生的数学
模型来分析和提取表征这些模型的特征参数)和非模型分析法(时域,频域,倒频域)。
2.数字化和预处理:数字化:带通滤波,增益控制,模数转换,编码调制。
预处理:预加重,加窗,分帧。
预滤波的目的(作用):①抑制高频分量,防止混叠干扰②抑制电源工频干扰
量化噪声特征:①平稳的白噪声②与输入信号不相关③等概率密度分布
预滤波器是一个带通滤波器,其上下截止频率分别为fh=3400hzfl=60~100hz采样频率为fs=
8khz
预加重数字滤波器一般是一阶的数字滤波器H(Z)=1-uz^(-1)
加窗,分帧的窗口的窗函数:要减小窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑
过渡到零,这样可以减小语音帧的截断效应,在频域要有较宽的3db带宽以及较小的边带
最大值。
采样周期,窗口长度,频率分辨率之间关系△f=1/(NT),如果N很大,它等效于很窄的低通
滤波器,语音信号通过时,反映波形细节的高频部分被阻碍,短时能量随时间变化很小,不
能真实反映语音信号的幅度变化,反之,N太小时,滤波器的通带变宽,短时能量随时间有
急剧变化,不能得到平滑的能量函数。
3.语音信号的时域分析:短时能量及短时平均幅度分析,短时过零率分析,短时相关分析
短时能量和平均幅度函数的主要用途:①区分浊音清音,浊音能量大②区分声母和韵母③
作为超音段信息。
短时过零率分析:作用①区分浊音清音,清音具有较高的过零率。②利用短时过零率从背景
噪声中找出语音信号。
浊音的短时平均幅度大,而短时过零率最低。清音的短时平均幅度居中而短时过零率最高,
无声的短时平均幅度最低而短时过零率据居中。
浊音才具有基音周期。
短时平均幅度差函数和自相关函数有密切的关系,表达式
kkRnRnk
Fn()2()[(0)()]^(1/2)
4语音信号的频域分析:傅里叶分析法。
5语音信号的倒谱分析:①线性预测分析②同态分析
同态信号处理:将非线性问题转化为线性问题。按被处理的信号由同态处理和卷积同态处理。
同态信号处理也称为同态滤波,它实现了将卷积关系变换为求和关系的分离处理,即解卷。
MEL倒谱分析着眼于人耳的听觉特性。
6.线性预测分析:用过去的样点值来预测现在或未来的的样点值
线性预测分析的基本思想:由于语音样点之间存在相关性,所以可以用过去的样点值来预测
现在或未来的样点值。即一个语音的抽样能够用过去若干个语音抽样或他们的线性组合来逼
近。
同时含有极点和零点:回归-滑动平均模型。全极点模型:回归模型。全零点模型:滑动平
均模型。语音信号
您可能关注的文档
- 仓储管理员工关系工作计划 .pdf
- 中职医学试讲教案范文模板 .pdf
- 中期汇报专家意见怎么写 .pdf
- 中山高电压试验设备项目投资分析报告模板范文 .pdf
- 中小学教师节主题活动学生代表发言稿 .pdf
- 中国建设银行消费借款合同(精选15篇) .pdf
- 中介买卖商铺合同范本 .pdf
- 个人门窗安装协议书范本 .pdf
- 个人职业生涯规划的内容优秀范文 .pdf
- 个人的职业规划范文五篇 .pdf
- 2024-2030年中国无缝文胸市场营销策略探讨与未来销售趋势研究报告.docx
- 2024-2030年中国易拉罐市场运营格局分析与未来营销渠道研究研究报告.docx
- 2024-2030年中国晶圆保护膜市场前景趋势展望及运营态势剖析报告.docx
- 2024-2030年中国晶圆市场全景调研与前景趋势预测分析研究报告.docx
- 2024-2030年中国晶圆片键合机行业需求预测及未来前景战略监测研究报告.docx
- 2024-2030年中国晶圆键合机行业未来发展趋势与投资潜力规划报告.docx
- 2024-2030年中国新闻网站行业市场深度调研及投资策略与投资前景研究报告.docx
- 2024-2030年中国晶圆校准器行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国智慧养老行业市场深度分析及市场需求与投资发展前景研究报告.docx
- 2024-2030年中国智能变电站监测行业市场发展分析及投资机会与战略研究报告.docx
文档评论(0)