- 3
- 0
- 约4.58千字
- 约 23页
- 2018-05-29 发布于江苏
- 举报
第二章多媒体信息处理()
* * 第二章 多媒体信息处理技术 2.1 多媒体信息处理技术概述 2.2 信息表示与编码 2.3 多媒体数据压缩技术 2.4 多媒体数据压缩技术标准简介 2.2 信息表示与编码 由于多媒体技术的应用必须是在计算机系统中进行的,因此,多媒体信息(如文字、图形、图像、视频、声音等媒体信息)必须数字化。 多媒体信息数字化的过程需要经过采用、量化、编码等处理。 数字化处理面临的主要问题就是巨大的数据量,尤其是对动态图形和视频图像。 下面就不同媒体的信息表示和编码技术进行简单的介绍。 一、字符、文本的表示和编码 1、字符编码 主要采用ASCII编码(ISO646、GB1988) 2、汉字编码 GB2312-80、GBK汉字内码、GB18030-2000、CJK 3、多文种文字编码 UCS(通用多8位编码字符集,也为ISO/IEC10646标准)、Unicode(统一码或联合码) 二、声音信号表示和编码 声音的种类分为:语音、音乐、其他声音(如风声、雨声、鸟叫声、汽车声等),频率的范围为20~20KHz,其中语音频率范围为300~3400Hz。 原始声音信号是一个物理模拟信号,需要进行数字化才能在计算机上进行处理和使用。 声音信号数字化分为三个步骤: 采样 : 采样频率不应低于声音信号最高频率的2倍(Nyquist theory),因此,语音信号采样频率一般为8KHz,而音乐信号采样频率为40KHz。 量化 : 量化的样值用若干位二进制(比特)来表示,二进制位数的多少反映了声音波形幅度的精度,称为量化精度(量化分辨率)。通常量化精度为8位、12位和16位,量化精度越高,保真度越好。 例如,若每个样值用8位比特(一个字节)表示,则样值的取值范围是0~255,则量化精度为1/256。 量化的方法有两类:均匀量化和非均匀量化。 非均匀量化的思想是:大的输入信号采用大的量化间隔,而小的输入信号则采用小的量化间隔。目的是在满足精度的前提下,可以使用较小的位数来表示输入信号。声音还原时,采用相同的原则。 非均匀量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系:μ律压扩算法和A律压扩算法。 编码 : 将量化后的数字信息通过一种或几种方法进行二进制编码,编码后的数字声音主要有几个重要参数:采样频率、量化位数、原始声音的声道数、码率(单位为kb/s或bps)、压缩编码方法。 单声道与双声道:记录声音时,如果每次生成一个声波数据,称为单声道;每次生成2个声波数据,称为双声道(立体声)。声道数是反映数字音频质量的一个重要指标。 数字音频的存储 通常编码过程也就意味着数据压缩过程。因为数字化后的声音信息的数据量很大。 数字化波形声音信号的存储数据量的计算公式为: 码率=(采样频率×量化位数×声道数)/8 (单位:B/s或KB/s) 数据量=码率×时间 (单位:B/KB/MB) 例如,具有CD音乐激光唱盘音质的波形声音,具有如下的典型参数:采样频率为44.1KHz,量化位数为16位,立体声声道数为2,则根据下列公式: 码率=(采样频率×量化位数×声道数)/ 8 (字节/秒) 则得到其码率=(44.1×16×2)/8 = 0.17MB/s。 那么,1小时的数据量为 数据量=码率×时间 =0.17×3600 =612MB/s 也就是说,如果不进行压缩编码,在一个容量为标准的650MB的光盘中存放的时间约为1个多小时的音频数据(大约能存储10多首歌曲)。 数字声音的数据压缩编码方法很多,从原理上大致分为3类: 波形编码(如PCM、ADPCM、子带编码等) 参数编码或模型编码 混合编码 数字声音的编码技术目前已经形成了国际标准,典型的有:ITU-G系列标准、MPEG系列标准。 数字音频的文件格式: 1)波形音频,如wav文件等,
原创力文档

文档评论(0)