第二章多媒体信息处理().pptVIP

下载本文档

3
0
约4.58千字
约 23页
2018-05-29 发布于江苏
举报

第二章多媒体信息处理().ppt

第二章多媒体信息处理()

* * 第二章多媒体信息处理技术 2.1 多媒体信息处理技术概述 2.2 信息表示与编码 2.3 多媒体数据压缩技术 2.4 多媒体数据压缩技术标准简介 2.2 信息表示与编码由于多媒体技术的应用必须是在计算机系统中进行的，因此，多媒体信息（如文字、图形、图像、视频、声音等媒体信息）必须数字化。多媒体信息数字化的过程需要经过采用、量化、编码等处理。数字化处理面临的主要问题就是巨大的数据量，尤其是对动态图形和视频图像。下面就不同媒体的信息表示和编码技术进行简单的介绍。一、字符、文本的表示和编码 1、字符编码主要采用ASCII编码（ISO646、GB1988） 2、汉字编码 GB2312-80、GBK汉字内码、GB18030-2000、CJK 3、多文种文字编码 UCS（通用多8位编码字符集，也为ISO/IEC10646标准）、Unicode（统一码或联合码）二、声音信号表示和编码声音的种类分为：语音、音乐、其他声音（如风声、雨声、鸟叫声、汽车声等），频率的范围为20～20KHz，其中语音频率范围为300～3400Hz。原始声音信号是一个物理模拟信号，需要进行数字化才能在计算机上进行处理和使用。声音信号数字化分为三个步骤：采样 : 采样频率不应低于声音信号最高频率的2倍(Nyquist theory)，因此，语音信号采样频率一般为8KHz，而音乐信号采样频率为40KHz。量化：量化的样值用若干位二进制（比特）来表示，二进制位数的多少反映了声音波形幅度的精度，称为量化精度（量化分辨率）。通常量化精度为8位、12位和16位，量化精度越高，保真度越好。例如，若每个样值用8位比特（一个字节）表示，则样值的取值范围是0～255，则量化精度为1/256。量化的方法有两类：均匀量化和非均匀量化。非均匀量化的思想是：大的输入信号采用大的量化间隔，而小的输入信号则采用小的量化间隔。目的是在满足精度的前提下，可以使用较小的位数来表示输入信号。声音还原时，采用相同的原则。非均匀量化中，采样输入信号幅度和量化输出数据之间定义了两种对应关系：μ律压扩算法和A律压扩算法。编码：将量化后的数字信息通过一种或几种方法进行二进制编码，编码后的数字声音主要有几个重要参数：采样频率、量化位数、原始声音的声道数、码率（单位为kb/s或bps）、压缩编码方法。单声道与双声道：记录声音时，如果每次生成一个声波数据，称为单声道；每次生成2个声波数据，称为双声道（立体声）。声道数是反映数字音频质量的一个重要指标。数字音频的存储通常编码过程也就意味着数据压缩过程。因为数字化后的声音信息的数据量很大。数字化波形声音信号的存储数据量的计算公式为：码率＝（采样频率×量化位数×声道数）/8 （单位：B/s或KB/s）数据量＝码率×时间（单位：B/KB/MB）例如，具有CD音乐激光唱盘音质的波形声音，具有如下的典型参数：采样频率为44.1KHz，量化位数为16位，立体声声道数为2，则根据下列公式：码率=（采样频率×量化位数×声道数）/ 8 （字节/秒）则得到其码率＝（44.1×16×2）/8 ＝ 0.17MB/s。那么，1小时的数据量为数据量＝码率×时间＝0.17×3600 ＝612MB/s 也就是说，如果不进行压缩编码，在一个容量为标准的650MB的光盘中存放的时间约为1个多小时的音频数据（大约能存储10多首歌曲）。数字声音的数据压缩编码方法很多，从原理上大致分为3类：波形编码（如PCM、ADPCM、子带编码等）参数编码或模型编码混合编码数字声音的编码技术目前已经形成了国际标准，典型的有：ITU－G系列标准、MPEG系列标准。数字音频的文件格式： 1）波形音频，如wav文件等，

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第二章多媒体信息处理().pptVIP