最新多媒体信息编码.ppt
第四章 数制和信息编码 多媒体分类 通常,人们将文本、音频、视频、图形、图像、动画的综合体笼统称为“多媒体”。由此可见,多媒体信息包括以下5种: 文本 图形、图像 动画 声音 视频影像 一、音频信息 1.基本概念 声音按频率分类 正常人所能听到的声音频率范围为20 Hz~20 kHz。 声音质量的频率范围: CD 如随身听 FM:调频 AM:调幅 2.模拟音频的数字化 3.数字音频的技术指标 采样频率和量化参数比较 4.数字音频的文件格式 5.声音的录制与播放 “录音机”是用于声音文件的录制与播放,还可以对声音进行编辑和特殊效果处理。 录制声音 编辑声音 删除声音 当前位置之前或之后 插入声音 移动声音 删除和插入间接完成 二、数字图像及处理 2.图像的数字化 采样 用多少个像素点的“列数×行数”表示,分辨率越高,图像越清晰,存储量也越大。 量化 量化是在图像离散化后,将表示图像色彩浓淡的连续变化值离化为整数值的过程。 把量化时所确定的整数值取值个数称为量化级数,也称为颜色深度. 颜色深度 ①黑白图 图像的颜色深度为1,则用一个二进制位1和0表示纯白、纯黑两种情况; ②灰度图 图像的颜色深度为8,占一个字节,灰度级别为256级。通过调整黑白两色的程度(称颜色灰度)来有效地显示单色图像; ③RGB 24位真彩色 彩色图像显示时,由红、绿、蓝三基色通过不同的强度混合而成,当强度分成256级(值为0~255),占24位,就构成了224颜色的“真彩色”图像。 图像的分辨率和像素位的颜色深度决定了图像文件的大小,计算公式为: 列数×行数×颜色深度÷8=图像字节数 例8.2 当要表示一个分辨率为640×480的“24位真彩色”图像,则需要: 640×480×24÷8≈1MB 由此可见,数字化后的图像数据量十分巨大,必须采用编码技术来压缩信息。它是图像传输与存储的关键。 2.常用图像文件格式 3. 图像数据的获取 三、 视频 常用视频文件格式 流媒体概述 常用流媒体文件 数据压缩技术 文件压缩和解压缩软件 多媒体信息编码 各类文字和符号 文字和符号 多媒体 多媒体 多媒体 通过计算而描述的矢量图形 文字 图形 矢量图形对象 ● 用像素点描述的自然影像 文字 图形 图像 位图图像对象 ● 单画面矢量动画和多画面帧动画 文字 图形 图像 动画 多画面帧动画 单画面矢量动画 FRAME 01 FRAME 02 FRAME 03 FRAME 04 FRAME 05 FRAME 06 FRAME 07 动画对象 ● 音频数字信号、压缩音频信号 文字 图形 图像 动画 音频 ● midi音频 ● wav音频 ● mp3压缩音频 音频对象 ● 视频数字信号AVI、压缩视频信号MPG 文字 图形 图像 动画 音频 视频 音频 + 视频 Audio Vedio Information 视频对象 ● END 声波:声源体发生振动会引起四周空气 振荡,振荡方式就是声波。 复杂的声波由许许多具有不同振幅和频率的正弦波组成。 周期T:重复出现的时间间隔; 振幅A:波形相对基线的最大位移, 表示音量的大小; 频率f:信号每秒钟变化的次数,即1/T 以赫兹(Hz)为单位。 把调制信号从低频搬移到了高频,以便利用电离层传播, 调频声音的高低变为频率的变化的电信号, 调幅就是用声音的高低变为幅度的变化的电信号. 用计算机对音频信息处理,就要将模拟信号(如语音、音乐等)转换成维数字信号。 采样 每隔一定时间间隔对模拟 波形上取一个幅度值。 量化 将每个采样点得到的幅度值 以数字存储。 编码 将采样和量化后的数字数据 以一定的格式记录下来 模拟信号 采样 量化 编码 数字信号 振幅 频率 1/T 采样点 T 振幅 1/T T 采样频率、量化位数和声道数 采样频率: 每秒钟的采样次数 量化位数(采样精度) :存放采样点振幅值的二进制位数。通常 量化位数有8位、16位,分别表示有28、216个等级。 声道数 :声音通道的个数 ,立体声 为双声道。 每秒钟存储声音容量的公式为: 采样频率×采样精度×声道数/8=字节数 例如,用44.10 kH
原创力文档

文档评论(0)