- 6
- 0
- 约 75页
- 2016-08-03 发布于广东
- 举报
第2章多媒体信息编码
为了保证图像质量主观评价的客观性和准确性, 可用一定数量观察者的质量分数的平均值作为最终主观评价结果, 其平均分数定义为: 其中, Ci为属于第i类图像的质量分数, Ki为判断该图像属于第i类图像的人数。观察者中应包括两类人员:一般人员和专业人员, 人数应多于20, 这样, 得出的主观评价结果才具有统计意义。 2. 客观评价 图像客观评价是用数学计算方法得到的。 通常, 采用计算图像逼真度和可懂度来评价。所谓图像逼真度,是指重建图像与原始图像之间的偏差程度; 所谓图像可懂度,是表示人或机器能从图像中抽取有关信息的程度。下面主要讨论图像逼真度。 通常, 图像逼真度用峰值信噪比PSNR来度量。 对于黑白图像, PSNR计算公式为 式中, f (i, j)为原始图像, f′(i, j)为重建图像, 图像尺寸为N×M, A为f (i, j) 中的最大值, 通常取255。 此外, 也可使用均方差方法来计算图像误差, 其数学表达式为: 2.4 语音编码标准 音频编码技术可分成两大类: 一类是波形编码或称真迹编码; 另一类是参量编码或称变换域编码。前者是将时间域信号直接变换成数字代码进行传输。 其特点是重建信号的质量较高, 即信号的信噪比高。 传输数码率为16~64 kb/s, 依所采用的编码方法而异。 后者是在信号源信号的频率域或其它正交域抽取其特征参数变换成数字代码进行传输, 接收端则从数字代码中恢复特征参数, 然后根据这些特征参数重建语音信号。其特点是重建信号的质量较低, 但数码率也比较低, 一般为几百b/s~9600 b/s, 多用于窄带信道传输。各种音频编码技术比较参见表2.5。 表 2.5 各种音频编码技术比较 编 码 类 型 数码率/(Kb/s) 复杂度/(MI/s) 复杂度/(MI/s) 波形编码: PCM ADPCM 自适应子频带 64 32 16 0.01 0.1 1 0 0 25 参量编码: 多脉冲线性预测 随机激励线性预测 线性预测声码器 8 4 2 10 100 1 35 35 35 2.4.1 PCM编码 脉冲编码调制(Pulse Code Modulation, PCM)是一种在现代通信系统中被广泛应用的语音编码技术, 也是数字传输中的标准接口信号。 ITU 在G.711建议书中定义了PCM编码方法及其标准。 PCM编码的主要优点是: ① 编码方法简单, 不需要用复杂的信号处理技术就可实现数据压缩, 而无任何信号延迟; ② 基于对话音信号波形采样的瞬时处理, 具有较高的信噪比。 图 2.10 PCM组成原理框图 对于电话信号编码, 由于其信号带宽为300~3400 Hz, 通常采用8 kHz频率进行采样, 而每一个采样脉冲用8位二进制码表示。 这样, 每个话音通道的数码率为: f =8000×8=64 kb/s 对于采用8位编码的正弦波信号, 其最大信噪比按下式计算: SNR(dB)=6.02×L+1.76=6.02×8+1.76=49.92 dB 式中, L为二进制编码位数。 如果要求信噪比至少保持在34 dB以上, 则信号的动态范围应当为49.92-34=15.92 dB, 显然这一动态范围远不能满足要求。 为了扩大信号的动态范围, 通常采用瞬时压扩特性。 瞬时压扩的目的是使信号在大的动态范围内具有均匀一致的信噪比。瞬时压扩的方法主要采用对数压扩特性, 即用一条通过原点正负对称的曲线逼近对数函数, 以实现对正负对称信号的对数压缩。 在ITU G.711建议中, 定义了两种对数压扩特性, 一种是15段折线近似是μ律; 另一种是以13段折线近似是A律, 美国、 日本等国家在数字通信中采用μ律压扩特性, 中国和欧洲一些国家采用A律压扩特性。 PCM编码/解码器通常采用单片集成电路(IC)芯片实现, 它将滤波、 放大、 量化、 压扩、 编码以及解码等功能集成一体, 具有处理速度快、 体积小、 成本低、 便于开发等特点。 例如, 美国Motorola公司的MC 14403就是这种单片PCM编码/解码器。 2.4.2 ADPCM编码 通常, 把低于64 kb/s数码率的的语音编码方法称为语音压缩编码, 其中自适应差分脉冲编码调制(ADPCM)是语音压缩编码中复杂度较低的一种方法。ADPCM能在32 kb/s数码率上达到符合64 kb/s数码率的语音质量要求, 即符合长途电话的语音质量要求。 ADPCM 编码的国家标准是ITU G.721
原创力文档

文档评论(0)