- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数字音频设计4
数字音频压缩编码技术 问题: 什么使音频的压缩成为可能? 音频压缩-音频压缩可行性 压缩的可行性:音频信号存在冗余 时域冗余/相关性 频域冗余/相关性,例如可以去除在听阈之外的频率 听觉冗余,例如各种掩蔽效应 这些冗余使音频数据压缩成为可能 问题: 音频编码技术有哪些? 如何分类? 音频压缩-音频编码技术的分类 按照编码方法分: 基于音频数据的统计特性的编码 基本目标是纪录重建波形所需要的信息。典型的是PCM(脉冲编码调制) PCM没有压缩,数据量大,存贮和处理不方便,改进型为DPCM(差分)、APCM(自适应量化)、ADPCM(自适应差分) 特点:音质好、压缩比不大、数据码率高 基于音频声学参数的编码 把声源看成一个随时间变化的时变滤波器,通过编码在不同时刻这个滤波器的参数达到数据压缩和编码的目的 MPE:multipulse excited 多脉冲激励 RPE: regularpulse excited 等间隔脉冲激励 CELP: code excited linear predictive 码激励线性预测 特点:压缩比高、码率低,但是音频质量差,自然度低 基于人的听觉特性的编码 利用人的心理声学模型(掩蔽效应)来压缩声音,目的是纪录“听觉上不失真”的声音 MPEG、Dolby AC-3 按照用途分: 话音编码 主要针对话音speech,要求码率低,便于传输,上面的2常用于话音编码 音频编码 主要针对音频audio部分进行编码,要求一定的保真度和声音的感觉还原(空间感、深度感等) 问题: 语音编码技术有哪些种类? 音频压缩-语音编码技术的分类 波形编译码器(waveform coder):不利用生成音频的信号的任何知识,将音频视为一种普通的声音,直接对波形信号进行采样和量化。例如PCM、DPCM、ADPCM等。 音源编译码器(Source coder):也叫参数编译码器、声码器(vocoder)。它从音频波形信号中提取生成音频的参数,使用这些参数通过音频生成模型重构出音频。 混合编译码器(Hybrid coder):综合使用上述两种技术。使用的激励信号波形尽可能接近于原始音频信号的波形。例如CELP 音频压缩- 三种语音编码译码器性能特点 波形编译码器(waveform codec):音频质量高,数据率也高 音源编译码器:数据率低,音频质量一般 混合编译码器:使用了前两种编译码器的技术,数据率和音质介于前两者之间。 问题: 波形编译码器如何实现? 音频压缩-波形编译码器 基本思想:不利用音频的任何特别知识,构造一种重构信号,该信号和原始的音频信号尽可能的一致。 特点: 复杂程度低 音频质量好 数据率需在16kb/s以上,在此之下,音频质量迅速降低 音频压缩-波形编码器的实现方法 PCM:pulse code modulation脉冲编码调制 原理:音频-〉采样-〉量化 已知:音频带宽3400Hz约4KHz,采样频率为4*2=8KHz,每个样本量化后用12位数据比表示,可得数据传输率为:96Kb/s 由于数据传输率比较高,通常采用压扩技术来减小数据传输率(解释) 将样本值取对数(对数量化器),这样可以将数据传输率减小到64kb/s 标准化的压扩量化器: 北美:μ律压扩标准 欧洲:A律压扩标准 问题: 什么是预测编码技术? 音频压缩-预测编码技术和差分脉冲编码调制 原理:利用过去的样本值来预测下一个样本值。由于音频的相关性,预测值和新样本值的差值幅度会小于样本幅度,记录这个差值而不是样本值就是差分脉冲编码调制DPCM(differential pulse code modulation)。 DPCM对急剧变化的信号会产生较大的噪声(解释) 我们从增量调制说起,因为它是较简单的预测编码技术 音频压缩-增量调制(△M) 斜率过载(slop overload):由于每次输出最大变化只能为△,当采样信号急速变化时,量化就不能反映信号的变化 粒状噪声:在信号变化缓慢的位置,量化后的信号却以△大小上下摇摆,造成噪音 斜率过载要求加大△,同时粒状噪声改善需要较小的△,这本身是一对矛盾 音频压缩-自适应增量调制(ADM) 基本原理:根据输入信号的斜率自动调整量化阶△,信号变化快,加大△,反之减小△。 例如:如果两次量化输出不变,量化阶增大50%,如果两次量化输出不同,减小50%量化阶 为什么这样可以克服斜率过载和粒状噪声? 连续可变斜率增量调制( CVSD:continuously variable slope delta modulation ): 如果编码器的输出连续出现三个相同的值,量化阶就加上一个大的增量;反之,就加一个小的增量。 Motorola公司的MC34XX,MC35XX系列芯片实现了CVSD算法 音
文档评论(0)