- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章数字音视频技术讲述
第2章 数字音视频技术 2.1 概述 2.2 音频信号数字化 2.3 音频信号压缩编码 2.4 语音压缩编码标准 2.5 IP电话技术 2.6 数字视频技术 2.1 概述 音调与基频 音色与谐波 音强与幅度 用动态范围来定义音频信号的相对强度: 动态范围=2 0×lg(信号的最大强度 / 最小强度)(dB) 信噪比 SNR 音宽与频带 声音的质量 声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。 声音质量 MOS标准 计算机模拟人类交流信息的过程: 2.2 音频信号数字化 音频信息处理主要包括音频信号的数字化和音频数据的压缩两大技术。在这一处理过程中涉及到模拟音频信号的采样、 量化和编码。 (1)标准采样频率 (2) 量化过程 量化的过程:先将整个幅度划分为有限个小幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。 量化噪声:量化误差,随阶距变大而增加。 - (Δ/2) ≤ e(n) ≤ (Δ/2) 量化位数/采样字长: 表示采样值的二进制位数(比特数),决定了采样值的精度。 数据量的计算 数据量(字节/秒) =(采样频率×采样字长×声道数)/8 采样字长为16bit 的双声道立体声歌曲,问一张容量为640MB 的CD唱盘最多能存储多长时间的CD音质? 每秒:(44100×16bit×2/8) = 176400 Byte (640×1024×1024)/176400 = 3804 s = 1h 3min 24s 数字声音相关的参数 WAV文件 (3)编码过程 编码过程是指用二进制数来表示每个采样的量化值。 如果量化是均匀的, 又采用自然二进制数表示, 这种编码方法就是脉冲编码调制(Pulse Code Modulation, PCM), 这是一种最简单、 最方便的编码方法。 2.3 音频信号压缩编码 从20世纪30年代提出PCM(脉冲编码调制)原理以及声码器的概念以来, 音频信息压缩编码技术主要是向基于波形和基于参数两个方向发展的, 从这个角度出发, 音频信息编码技术可分为三类: (1) 波形编码 主要基于语音波形预测, 它力图使重建的语音波形保持原信号的波形状态。 优点:编码方法简单、 易于实现、 适应能力强、 语音质量好等。 缺点:压缩比相对来说较低, 需要较高的编码速率。 常用的波形法编码技术有增量调制(DM)、 自适应差分脉冲编码调制(ADPCM)、 子带编码(SBC)和矢量量化编码(VQ)等。 (2) 参数编码 与波形编码不同的是, 这类编码方法通过语音信号的数学模型对语音信号特征参数进行提取及编码, 力图使重建的语音信号尽可能保持原信号的语意, 而重建的语音信号波形同原信号的波形可能会有较大的区别。 基于这种编码技术的编码系统一般称为声码器, 它主要用于在窄带信道上提供4.8 kb/s以下的低速语音通信和一些对延时要求较宽的应用场合(如卫星通信等)。 最常用的参数编码法为线性预测编码(LPC)。 (3) 混合编码 克服了原有波形编码与参数编码的弱点, 并且结合了波形编码的高质量和参数编码的低数据率, 取得了比较好的效果。 无论是在音频信号的数据压缩中, 还是在图像信号的数据压缩中, 混合编码均被广泛采用。 2.4 语音压缩编码标准 1. G.711标准 1972年制定的电话质量的PCM语音压缩标准, 采样频率8 kHz, 每个样值采用8位二进制编码, 速率为64 kb/s。 推荐使用A律或μ律的非线性压扩技术, 将13位的PCM按A律, 14位的PCM按μ律转换成8位编码。 广泛用于数字语音编码。 2. G.721标准 ITU-T于1984年制定的, 用于64 kb/s的A律和μ律PCM与32 kb/s的ADPCM之间的转换。 基于ADPCM技术, 采样频率为8 kHz, 每个样值与预测值的差值用4位编码, 其编码速率为32 kb/s, ADPCM是一种对中等质量音频信号进行高效编码的有效算法之一,
您可能关注的文档
最近下载
- 2025年广西公需科目第二套答案.docx VIP
- 2025最新事业单位招聘考试公共基础知识法律基础知识试题库含答案详解ab卷.docx VIP
- 2025年事业单位招聘考试公共基础知识法律基础知识试题库附答案详解ab卷.docx VIP
- 马克思政治经济学课件.pptx VIP
- 玻璃幕墙技术交底记录(全部).docx VIP
- 干挂石材技术交底.docx VIP
- 2025年公共基础知识试题库附答案附答案详解ab卷.docx VIP
- 微生物实验室质量控制2009.ppt VIP
- 等腰三角形与等边三角形篇(解析版).pdf VIP
- GB 50058-2014 爆炸危险环境电力装置设计规范(附条文说明).pdf VIP
文档评论(0)