- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CodingandDecoding文稿.doc
Coding and Decoding
_视频编解码
帧
电影是通过以每秒24帧的播放速度将连续画面投射在大屏幕上,每幅画面称为一帧,实现动态效果。
计算机中帧播放速度
每幅的画面以每秒25个画面的速度顺序取代前一个画面,构成PAL视频制式;
每幅的画面以每秒30个画面的速度顺序取代前一个画面,则构成NTSC视频制式。
信息与数据
信息与数据
信息可以用函数表示,该函数由信息论创始人C.E.Shannon提出,以概率论的观点对信息进行定量描述,具体的信息函数表达式为:I(ai ) = -log2Pi (i = 1,2,…,r )
公式中,Pi (i = 1,2,…,r )是随机消息组合X{a1,a2,…,ar}中的消息ai (i = 1,2,…,r )的先验概率。Pi 可以度量ai (i = 1,2,…,r )所含的信息量。而I(ai) (i = 1,2,…,r )在X的先验概率空间P{p1,p2,…,pr}中的统计平均值为信息源X的熵.
信息源X的熵用来度量X中每种消息所包含的平均信息量。信息熵主要表示信息系统的有序程度,而不是热力学中系统的无序程度。
多媒体信息的数据量
多媒体信息的数据量
1) 文本 —— 假设屏幕显示分辨率为1024×768,字符为16×16点阵,每个字符用4个字节表示,则显示一屏字符所需要的存储空间为:
(1024/16)×(768/16)×4 B = 12288 B(约合12KB)
2) 图像 —— 假定图像显示在1024×768分辨率的屏幕上,则满屏幕像点所占用的空间为:
1024×768×log2256 = 768 KB
3) 音频 —— 假定模拟声音频率22050 Hz,其数字采样频率44100 Hz,采样精度为16bit,双声道立体声模式,则1min所需数据量为:
44100Hz×2B (16bit采样精度)×2 (双声道)×60s = 10 MB/min
4) 视频 —— 采用带宽为5MHz的PAL制视频信号,扫描速度25帧/ s,样本宽度24bit,采样频率最低10MHz,则一帧数字化图像所占用的最少存储空间为:
10 (采样频率)÷25 (扫描速度)×24 (样本宽度) = 9.6Mbit (合1.2 MB)
数据压缩的条件
● 数据冗余度 (重复数据、可忽略数据)
● 人类不敏感因素 (颜色、亮度、细节等)
颜色不敏感因素
音频不敏感因素
● 信息传输与存储的限制 (压缩 → 传输或存储 → 解压缩)
冗余基本概念
● 冗余 —— 信息所具有的各种性质中多余的无用空间
● 冗余度 —— 多余的无用空间的程度
● 信息量与冗余的关系
I = D - du
I — 信息量 D — 数据量 du — 冗余量,包含在D中
冗余举例
播音员—— 180字/分钟,2Byte一个字,360Byte (合0.35KB/分钟)
音频数据——8kHz采样×8bit×60秒 = 3840KBit (合480KB/分钟)
动态图像MPEG压缩编码技术
基本原理
1.动态图像压缩主要解决的问题
1) 正确区分静止图像和动态图像。
2) 提取动态图像中的活动成分。
3) 进行帧之间的预测,提供压缩的依据。
2.帧的预测编码
1) 条件像素补充法
—— 比较两帧对应位置的像素亮度,若亮度差超过预先规定的阀值,则认为两个像素有变化,传送像素。若亮度差未超过阀值,不处理。
2) 运动补偿法
—— 跟踪画面上的活动元素,并进行向量计算,加以补偿,然后再利用帧间预测进行压缩。适用于活动元素少的可视电话和电视会议。
图像的分类
● MPEG标准根据处理图像的性质,把图像分成以下三类:
1) 帧内图像(Intra pictures)
—— 又称“I图像”,JPEG标准按照静止图像的模式进行压缩处理。主要利用静止图像自身的相关性进行编码,实现数据压缩的目的。
帧内图像的压缩比属于中度压缩,典型的压缩像素编码为2 bit。
2) 预测图像(Predicted pictures)
—— 又称“P图像”,通过对最近的前一帧I图像或者P图像进行预测的“前向预测”过程,把前面图像作为预测下一帧图像的参照物,使图像编码的数据量减少。预测图像有较高的压缩比,但会增加失真。
3) 双向图像(Bidirestional pictures)
—— 又称“B图像”,可使用前一帧图像和后一帧图像作参照物,进行双向预测。双向预测可以采用四种编码技术,即帧内图像编码、前向预测编码、后向预测编码、双向预测编码。
MPEG技术标准
● MPEG-Ⅰ标准
●
原创力文档


文档评论(0)