- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音重点总结
1.function of prefilter:suppress the component of input signal which exceed fs/2, prevent aliasing ; suppress Interference caused by 50Hz electricity。
prefilter is band-pass filter,in general,low and up cut-off frequency are: fH=3400Hz, fL=60~100Hz。
2. sampling:transform time continuous signal into a time discrete signal
气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,期间的传输通道称为声道。气流流过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置的峰起,称为共振峰。
短时自相关函数和长时自相关函数可以用来描述语音的幅度特性
功率谱密度:1.语音中不同频谱分量的平均概率可以用长时平均谱密度来表示。2.语音波形高频分量对语音总能量的贡献很小,但是高频分量带有重要的语音信息,平均功率谱约在250-500Hz处最大,而高于此频率的功率谱约以每倍频程6~10dB下降。3..语音信号的短时频谱并不总是低通特性。辅音有较高的频谱分量,显噪声特性;元音从总体上看是低通的,显示明显的局部特性。
语音信号具有很强的“时变特性” 在有些段落中它具有很强的周期性,有些段落中又具有噪声特性,而且周期性语音和噪声语音也在不断变化之中。
语音信号是非平稳的,但具有“准平稳特性” 在较短的时间间隔内(一般20~200ms),可以认为语音信号的特征基本保持不变。
数字语音信号处理中,通常采取短时分析技术。
元音和辅音的区别:1.从功能上来讲,元音往往能自成音节,辅音一般不能独立地构成音节。2.在物理属性方面,元音基本上由乐音构成,辅音则有一定的噪音。3.在听觉上,发元音时,声带振动,比较响亮;发辅音时,有的声带不振动,自然不够响亮,有的声带即使振动,但由于在声腔中受到某种阻碍,还是不如元音响亮。4.在生理属性方面,主要有三个方面的区别:第一,发辅音的时候,发音器官的某一部位形成阻碍,气流在只有克服阻碍才能发出来;发元音的时候,气流通过生门使声带发生振动,气流在其通道上不受到阻碍,只受到各种共鸣。第二,发辅音时,因为要克服某种阻碍,气流就比较强;发元音时,因无需克服阻碍,气流就比较弱。
决定元音音质的因素:主要有三个方面的因素,一、舌位的高低,二、舌位的前后,三、嘴唇的圆展。这三个因素的不同组合,便能发出不同的元音
在求语音信号频谱时,频率越高,相应的成分越小。预加重的目的是提升高频部分,使信号的频谱变得平坦。以便于频谱分析和声道参数分析。 一般在语音信号数字化后,通过一个一阶数字滤波器:H(z)=1-(z-1, (接近1。
为什么取10-30ms,因为根据人的发声生理结构变化的连续性,在此时间段内,声带、声道、口腔的特性几乎不变,语音信号近似平稳。
加窗的作用:得到连续的语音特征 抑制吉尔伯特效应 抑制频谱泄漏
窗口的长度N:频率分辨率(f=fs/N。(f随N的增加而减少,频率分辨率得到提高,但时间分辨率降低(与窗长成反比)。应根据不同的应用场合来选择窗口的长度N,应包含7个基音周期,因此可选择100~300点为宜。
时域波形:幅度-时间图。大致得出音节的起始点、清音和浊音以及浊音的基音频率
频谱特性:幅度谱图。得出基音周期、共振峰频率及其位置。
语音信号的时域分析: 短时能量及短时平均幅度分析(1.幅度分析的依据:是基于语音信号幅度随时间变化。清音段幅度小,其能量集中于高频段;浊音段幅度较大,其能量集中于低频段。2.短时能量函数和短时平均幅度函数作用:(1)区分清/浊音:(2)在信噪比高的情况下,能进行有声/无声判决(3)大致能定出浊音变为清音的时刻,或反之) 短时过零率分析 (定义:信号跨越横轴的情况。对于连续信号,观察语音时域波形通过横轴的情况;对于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。作用:1.区分清/浊音:浊音平均过零率低,集中在低频端;清音平均过零率高,集中在高频端。2.从背景噪声中找出是否有语音,以及语音的起点。) 短时相关分析 短时平均幅度差函数
在实际应用中,短时平均过零率容易受到A/D转换是的直流偏移、50Hz交流电源的干扰以及噪声的影响.减少这些干扰可以有两种方法:一种是采用带通滤波器消除信号中的直流和50Hz低频分量;另一种是用过门限率来修改过零率,减少随机噪声的影响。
短时自相关函数的定义:
(1)说明当时域信号为周期信号时,自相关函数也是周
您可能关注的文档
最近下载
- 如何将自己的手机号设置成空号.docx VIP
- 云南省交通规划设计研究院有限公司招聘笔试题库2025.pdf
- 《电气工程基础》(熊信银_张步涵_华中科技大学)习题答案全解 (2).doc VIP
- 急性冠状动脉综合征患者规范化诊疗中国专家共识(冠心病).pptx
- 北师大级硕士研究生“自然辩证法概论”复习题(带答案) .pdf VIP
- 企业劳动用工法律风险调查表.pdf VIP
- 《电气工程基础》(熊信银张步涵华中科技大学)习题答案全解.docx VIP
- 阳痿护理查房课件.pptx VIP
- 护士科室火灾应急预案演练脚本精选(两篇).docx
- 2025年及未来5年中国智慧机场行业市场评估分析及发展前景调研战略研究报告.docx
原创力文档


文档评论(0)