语音编码幻灯片.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音编码(speech coding);√概述; 编码、传输、存储和译码是语音数字传输和数字存储的必要过程。 随着语音通信技术的发展,压缩语音信号的传输带宽,降低信道的传输速率,一直是人们追求的目标。语音编码在实现这一目标的过程中担当重要的角色。 语音编码就是使表达语音信号的比特数目最小。;数字传输系统模型;语音编码应用实例(IP电话);二、编码速率(信息容量);三、编码的分类;2.参数编码(声源编码 parametric coding): 根据语音信号产生的数学模型,通过对语音信号特征参数的提取后进行编码(将特征参数变换成数字代码进行传输)。在接收端将特征参数,结合数学模型,恢复语音,力图使重建语音保持尽可能高的可懂度,重建语音信号的波形同原始语音信号的波形可能会有相当大的区别。如线性预测(LPC)编码类。编码速率低,2.4-1.2kb/s,自然度低,对环境噪声敏感。;;;3.混合编码(Hybrid coding): 将波形编码与参数编码相结合,在2.4-1.2kb/s速率上能够得到高质量的合成语音。规则码激励长时预测编码RPE—LPT即为混合编码技术。混合编码包括若干语音特征参量又包括部分波形编码信息,以达到波形编码的高质量和参量编码的低速率的优点。;四、已经标准化的语音编码 指定组织:国际电信联盟 ITU-T, ;;(5)RPE-LTP:长时预测的规则脉冲激励的线性预测Regular-Pulse Excited LPC with a Long-Term Predictor;√语音信号压缩编码的原理及其评价系统;一、语音压缩的基本依据;2.存在的频域冗余度: (1)非均匀的长时功率谱密度 (2)短时功率谱密度 ;女声英文a的功率谱;3.人的听觉感知机理 (1)人类的听觉特性具有掩蔽效应 (2)人耳对不同频段声音的敏感程度不同 (3)人耳对语音相位不敏感;4. 语音编码的极限速率 语音中最基本的元素是音素,大约有128~256个,如果按通常的说话速度,每秒平均发出10个音素,则信息率为: I=[log2(256)10]bps=80bps 把发音看成是以语音速率来传送,则语音编码的极限速率为80bps,从数字化标准的编码速率64kbps,到极限速率80bps,之间的距离,对于理论研究和实践有着极大的吸引力。;二、??音编码的关键技术;; D为基音周期,长时预测系数{bi}的个数取1(q=r=0)或3(q=r=1)。 D、{bi} 从语音信号中直接提取。语音信号通过长时预测,得出基音周期、增益(振幅大小)。;;3.感觉加权滤波器;输入语音x(n);三、语音压缩系统的性能指标和评测方法;编码延时;A端的信号+B端经混合线圈的回传信号;2.语音压缩系统的性能指标和评测方法; 评价指标:清晰度或可懂度、音质。前者是指语音是否容易听清楚;后者指语音听起来有多自然。 (1)可懂度评价 DRT:Diagnostic Rhymer Test (2)音质评价: MOS:Mean Opinion Score 平均意见得分和DAM:Diagnostic Acceptability Measure 判断满意度得分。; MOS得分为五级:优、良、可、差和坏。满分为5分,相当调频广播质量;4分以上是长途电话网标准;3.5分为通信标准; 3.0分仍有较好的可懂度,保持自然度;2.5分只维持可懂度, 是战术通信标准。 ;(1)波形失真度,用信噪比来度量 (2)频谱失真测量 (3)谱包络失真测量;语音信号的波形编码; 均匀量化时,无论大的输入信号还是小的输入信号一律采用相同的量化间隔,为了适应大的输入信号,同时又要满足精度要求,就需要增加样本的位数。 ?=2V/L=2V/2R,但是对话音信号来说,大信号出现的机会并不多,增加的样本数就没有充分利用。因此采用非均匀量化。;; 其基本思想是:大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔。在满足精度要求的情况下用较少的位数来表示。译码时,采用相同的规则。也可视为将信号进行非线性变换后再作均匀量化,如对信号进行对数压缩,微弱的信号被放大,强的信号被压缩。译码时,指数扩张。; 现在的非均匀量化中,一般采用两种压缩扩张非均匀量化方法。采样后信号幅度和量化数据之间有两种对应关系,一种称为u 律压扩(companding)算法,另一种称为A 律压扩算法。 u 律压扩主要用于北美和日本等地区的电话通信中。 A 律压扩主要用在欧洲和中国的地区的电话通信中。;(1)输入xa(nT)的范围归一化为(-1~+1); (2)输出FA(x(n))的范围为(-1~+1);

文档评论(0)

lifang365 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档