- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北邮版 数字通信原理 第三章解析.ppt
语音编码发展方向 极低速率语音编码 比特率低于2400bps的编码 保密通信、语音邮件、网络通信、IP电话 变速率语音编码 在合成语音质量和系统容量中灵活折中 CDMA通信系统中,且前景广阔 不压缩语音编码 压缩费用超过传输费用 光纤通信、微波通信 压缩的意义 为什么需要压缩编码技术 PCM编码占用带宽大 8000Hz采样速率,每样本8位码 数码率:64kbps 有线传输中可以找到大容量传输介质:光纤 无线接入侧的频谱资源相当紧张 GSM频点分配 定义: 低于64kbps的编码方案称为语音压缩编码 压缩依据 语音信号中存在的冗余 人类的听觉感知机理 信号冗余——时间域 信号的非均匀分布 小幅度概率高,信息集中在低功率信号上 采样数据样值间的数据相关性 8kHz速率时,相邻样值相关系数高达0.85 周期间相关性: 浊音的准周期性 全双工通话时存在通话间隙 信号冗余——频率域 长时功率谱密度的非均匀性存在固定的冗余度 对给定的频段利用不够充分 短时功率谱密度在某些频率上存在高振峰,而在另外一些频率上是低谷值 频谱特征主要由三个共振峰频率决定 听觉感知机理 人耳有掩蔽效应(masking effect) 强音抑制弱音 人耳对不同频段的声音敏感度不同 低频比高频更敏感 人耳对语音信号的相位不敏感 3.1.2 压缩编码方法分类 波形编码 原理简单,失真小 数码率高 参量编码 数码率低 音质较差,复杂度高 混合编码 较低的比特率上获得较高的语音质量 语音编码的极限速率 语音最基本元素-音素:大约128~256个 通常说话速度:每秒平均发10个音素 信息率: I=[log2(256)10]bps=80bps 把发音看成是以语音速率传送,则语音编码的极限速率为80bps 从数字化标准的编码速率64kbps,到极限速率80bps之间的距离,压缩比可达64kbps/80bps=800 对于理论研究和实践有着极大的吸引力 3.1.3 语音质量评价 语音质量 (1)广播级: 宽带(0-7000Hz)高质量的语音,感觉不出噪声存在 (2)网络或电话级: 200Hz-3200Hz,信噪比大于30db。 (3)通信级: 完全可以听懂,但和长途电话相比,有明显失真。 (4)合成级: 80%-90%可懂度,音质较差,听起来像机器讲话,失去了讲话者的个人特征。 子带编码(SBC)是首先用带通滤波器将语音信号分割成几个不同的频带分量(子带),再分别对每个子带进行抽样和编码。编码后的码流通过复接器复接,送到信道上传输。接收端再将它们分接、译码,并组合起来重建原始的输入信号。下图就是子带编码的原理方框图。 子带编码比特分配与编码速率 在子带编码器的设计中,必须考虑子带数目、子带划分、编码的参数、子带中的比特分配以及带宽等主要参数。 设一个子带编码系统包括m个子带,各子带带宽为Bk(k=1,…,m),每个子带信号经过频率为fsk=2Bk的抽样后,使用Rk个比特来进行量化和编码,那么该系统总的编码速率I应为式(3-4) 线性预测编码(linear predictive coding,LPC) 话音压缩技术。将话音生成机理模型化为一个离散的、时变的、线性的递归滤波器 编码时使用线性预测分析话音波形产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就可减少声音的数据量 译码时使用线性预测分析得到的参数,通过话音合成器重构话音。合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型 时变线性滤波器 分析话音波形时,当作预测器使用 合成话音波形时,当作生成模型使用 线性预测器 使用过去的P个样本值来预测现时刻的采样值x(n),如图3-18所示 补充知识:时变数字滤波器 预测值用过去P个样本值的线性组合表示为 预测系数 通过求解偏微分方程,可找到系数ai的值 如果把发音器官等效成滤波器,这些系数ai可以理解成滤波器的系数 在接收端重构的话音不再具体复现真实话音的波形,而是合成的声音 主要缺点 需要进行基音检测和清浊音判决,精确测量这两组数据非常困难,而其误差对合成语音质量有很大影响 通道数量有限,可能几个谐波分量会落入同一通道,合成时被赋予相同的幅度,导致合成信号的频谱畸变 对整体的语音信号进行分析,提取信号中共振峰的位置、幅度、带宽等参数,构成对应清音和浊音的两个声道滤波器。 清音滤波器一般采用1个极点和一个零点的数字滤波器。 浊音滤波器采用全极点滤波器,由多个二阶滤波器级联而成 比通道声码器合成的语音质量要好,比特率可以压缩得更低。 LPC声码器性能不佳的主要原因不在于声道模型本省,而在于对激励信号的表示过于简单,因为只是采用了清音和浊音两种激励源。 混合编码多以线性预测编码(LPC
文档评论(0)