- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅论语音编码
戴福山(长春理工大学 110421227)
摘要:本文主要介绍了语音编码的理论基础、方法的分类和几种典型的语音编码方法, 分析了各种方法的特点及应用环境, 同时简要分析了当前语音编码总体上三个大的发展方向: 极低速率语音编码、变速率语音编码和不压缩语音编码, 并说明了它们的应用领域。
关键词:语音编码 语音编码典型方法 语音编码的发展方向
引言
语音编码是将模拟语音信号数字化的手段.语音信号数字化后, 可以作为数字数据来传输、存储或处理, 因而具有一般数字信号的优点。在近半个世纪的研究中, 各国研究人员做出了大量努力, 从人类的发生机理、听觉机理、心理因素以及语音信号的时域特性、频域特性等多个方面进行了大量研究, 从不同角度提出了多种信号编码方法。
一、概述
语音编码是将模拟语音信号数字化的手段.语音信号数字化后, 可以作为数字数据来传输、存储、或处理,因而具有一般数字信号的优点。 话音数字化的技术基本可以分为两大类: 第一类方法是在尽可能遵循原波形的前提下, 将模拟波形进行数字化编码。其中三种最常用的技术是脉冲编码调制( CP M )差分P C M ( D P C M ) 和增量调制( △M ) ; 第二类方法是对模拟波形进行一定处理, 但仅对话音和收听过程中能收听到的话音部分进行编码。第二类语音数字化方法主要与用于窄带传输系统或有限容量的数字存储设备的话音编解码器有关。采用该类技术的设备一般被称为声码器( 语音编码器) 。声码器技术现在正开始展开应用, 特别是用于帧中继和IP 上等语音。
近年来, 由于数字信号处理器体系结构和人类说话与识别方面研究的进步, 使话音编解码技术得到迅速的发展。新的编解码技术不仅提供模拟转换, 而且提供复杂的预测模式, 可以分析话音输入,并用最少带宽传输话音。
二 语音编码的理论基础
2.1 语音编码的目的
为了使信号适于处理、传输和存储, 我们需要对语音信号进行压缩,语音编码就是要在保证语音质量的前提下得到尽可能少的数据, 所以也常把语音编码叫做语音压缩编码。
2.2 语音压缩编码的可行性
(1)语音信号中存在大量冗余信息, 即: 语音信号样本件具有很强的相关性; 浊音语音段具有准周期特性; 声道的形状及其变化的速率有限;传输码元的概率分布非均匀。
(2)人耳对声音信号中的部分信息不敏感, 即人耳对声音中的低频成分比高频成分敏感; 人耳对语音信号的相位特征不敏感; 人耳中存在“听觉掩蔽( Auditory Masking) ”效应, 即某一声音引起听觉器官对另一声音的敏感度下降。掩蔽的程度取决于掩蔽声的强度及掩蔽声与被掩蔽声之间的频率关系。
正是由于这些原因的存在, 我们才可以对语音信号进行各种各样的处理, 理论研究和实际应用中出现的各种编码技术都是以此为基础的。
语音编码技术原理及应用
3.1语音编码的技术分类
语音编码主要有三种方式:波形编码、声码器和混合编码,而近年来“感知编码”也逐渐开始步入实际应用行列 ,通常把编码速率低于64 kbps 的语音编码方式称为语音压缩编码技术.,下面分别介绍这四种编码方法。
3.1.1 波形编码
波形编码针对语音波形进行的, 这种方法在降低量化每个语音样本比特数的同时又保持了相对良好的语音质量.波形编码包括时域编码和频域编码。
(1)时域编码
时域编码主要有脉冲编码调制(PCM)、差分脉码调制(DPCM)、增量调制(ΔM)、自适应差分脉码调制(ADPCM)、自适应增量调制(ADM)、自适应预测编码(APC)等。
线性PCM 是用同等的量化级进行量化, 没有利用声音的性质, 所以信息没有得到压缩, 对数PCM 利用了语音信号幅度的统计特性, 对幅度按对数变换压缩, 将压缩的结果作线性编码, 在接收端解码时, 按指数扩展, 这种方法在数字电话通信中得到了广泛的应用,PCM 最大缺点是数码率高, 在传输时所占频带较宽。
差分脉码调制(DPCM)是根据相邻采样值的差值信号进行编码, 图1 是DPCM原理方框图。ADPCM 是在DPCM 的基础上发展起来的, 其量化器与预测器的参数能根据输入信号的统计特性自适应于最佳或接近于最佳参数状态.ADPCM 是语音编码中复杂程度较低的一种方法。
增量调制是根据信号的瞬值是否增大或减小, 即根据增量编码, 用一位二进制码序列对模拟信号进行编码.这种方法简单, 实现容易, 但由于量阶固定, 量化噪声功率固定, 所以当信号下降时, 信噪比(SNR)下降.为了改进这种方法的动态范围, 引进了自适应技
文档评论(0)