- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
7.1概述 7.2语音信号压缩编码原理系统压缩评价 7.3语音信号的波形编码 7.4语音信号的参数编码 7.5语音信号的混合编码 7.6现代通信中的语音信号编码 7.1 概述 语音编码(Speech Coding) 从信息论角度看,信源编码是要以最少的数码表示信源所发的信号,语音编码属于信源编码的范畴。语音编码通过减少传输码率(或存储量),来达到提高传输(或存储)效率的目的。作为传输语音的压缩技术,语音编码在通信史上一直都扮演着极为重要的角色。 语音编码分为三类: * 波形编码:重建后的语音时域信号的波形与原语音信号保持一致。 * 参数编码:通过建立语音信号的产生模型,提取其特征参数来编码,波形上不要求与原信号匹配,又称声码器技术。 * 混合编码:有机结合以上两种编码方式,基于语音产生模型的假定并采用分析合并技术。 三种编码方式的比较 语音编码发展史 自从20世纪30年代脉冲编码调制(PCM)被提出起,语音编码在60多年的时间里得到了迅速的发展。 早期的声码器基于对语音信号基音周期与频谱的分析,主要包括通道声码器,共振峰声码器与模式匹配声码器。20世纪50年代后期,着重于线性语音源系统生成模型,包括线性慢时变系统,周期脉冲激励序列与随机激励。 20世纪六七十年代,VLSI技术与数字信号处理理论的发展为语音编码技术开辟了新的道路,语音分析合成采用了短时傅立叶变换,变换编码与子带编码,基于线性预测的编码技术进一步得到发展。新的编码技术纷纷产生,如余弦分析合成技术,多带激励声码器,LPC中的多脉冲与矢量激励,矢量量化。到20世纪90年代中期,速率为4~8Kbps的波形与混合编码器,在语音质量上,与早期速率为64Kbps的PCM波形编码器已十分接近。 7.2 语音信号压缩编码原理系统压缩评价 语音信号中存在着冗余度(包括时域与频域),人的听觉感知机理也有很多可以利用的特点。语音信号压缩编码之所以可行,正是因为这两种情况的存在。 语音编码依据之一:语音信号冗余度 基本时域冗余: 语音信号幅度非均匀分布性 语音信号样本间的强相关性 浊音语音段具有的准周期性 声道形状及其变化的缓慢性 静止系数 (即语音间隙性) 基本频域冗余: 从长时间的功率谱密度来看,语音信号具有强烈的非平坦型,存在着固定的冗余度。而且高频能量通常较低,恰好对应于时域上的相邻样本相关性。 从短时功率谱密度来看,语音信号在不同频率交替出现峰值(共振峰)与谷值。整个功率谱的细节基于基音频率形成高次谐波结构。 语音编码依据之二:人的听觉特点 人类听觉系统存在着掩蔽系统,即高声级单音会明显掩蔽临近频率声音。 对于不同频段的声音,人耳的敏感程度不尽相同。 人类对于语音信号的周期性(即音调)极为敏感,但对信号的相位却充耳不闻,这与理论分类存在差异。 语音编码中的几项关键技术 线性预测 线性预测传送整个反应过程变化的参数,其出发点在于跟踪波形的产生过程而非波形本身。基于全极点模型假设,使得语音信号编码的比特率得到有效的降低。 语音信号中存在的两点相关性 样点间的短时相关性 相邻基音周期之间的长时相关性 语音信号的短时相关性可用一个全极点模型来描述,其传输函数H(z)为: 而滤波器 合成分析 合成分析原理 合成分析在编码器中加入综合器,并将其与分析器结合从而产生与译码器端相同的语音,而后根据误差原理调整使得误差最小化。 合成分析背景 16Kbps以下的高质量语音编码在当今得到的极大关注,使得传统的量化方法对误差最小化已无能为力。因此,合成分析的方法被引入。 感觉加权滤波器 产生背景:理论与现实的出入 对于低码率(4~16Kbps)的语音编码,理论上的最小均方误差(MMSE)在实际应用时却因为人的听觉特点而障碍重重。在这种背景下,根据人耳上网掩蔽效应设计的感觉加权滤波器得到了广泛的应用。 在实际应用中,共振峰处的噪声相对于能量较低处的频段更加不易被察觉,故高能量段处的误差要求不高。因此,感觉加权滤波器 被提出,用以衡量语音间的误差。 此时,只需 在高频段处较小,低频段处较大,就可以升高不敏感的高频段处误差同时降低较敏感的低频段处误差,从而达到目的。 其传递函数为: 的作用就是使实际信号误差的谱呈现与语音信号类似的包络形状,从而在掩蔽效应的作用下在主观听觉上产生较好的效果。 语音压缩系统的性能评判指标 较为重要的性能评价准则 编码速率(比特率),决定了编码器工作时占用的信道带宽,要求尽可能降低。 编码器的完健性,要求良好。 编码器的时延,要求最小化。 误码容
原创力文档


文档评论(0)