多媒体第一章..pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息压缩的必要性 从上图可以看出: 未进行任何形式编码和压缩的窄带语音信号需要128 kb/s的速率, 即两倍于普通电话的速率。 信号未被压缩的宽带话音需要256 kb/s的速率, 未压缩的双声道立体声CD音频需要1.41 Mb/s的速率。 在保持原始信号质量的前提下, 窄带语音可以压缩到4 kb/s(30∶1的压缩比), 宽带话音可以压缩到约16 kb/s(15∶1的压缩比), CD音频可以压缩到64 kb/s(22∶1的压缩比)。 显然, 多媒体信号在进行有效的存储和传输之前, 必须进行处理, 而最关键的处理方法是进行数据压缩。 信息压缩的可行性 研究表明,一个文件所包含的数据量并不等于它所包含的信息量,数据中通常包含很大的冗余,其关系如: D=I+r 其中D为数据量, I为信息量,r为冗余量。 压缩:在多媒体信息中包含大量冗余的信息,把这些冗余的信息去掉的过程。 信息压缩的可行性 音频、图像和视频数据中存在的冗余主要有以下几种: (1)空间冗余 图象本身的数据冗余 在任何一幅图像中, 均有许多灰度或颜色都相同的邻近像素组成的局部区域, 它们形成了一个性质相同的集合块, 即它们之间具有空间(或空域)上的强相关性, 在图像中就表现为空间冗余。 空间冗余的压缩方法:把这种局部区域集合块当作一个整体, 用极少的数据量来表示, 从而节省存储空间。 这种压缩方法叫空间压缩或帧内压缩, 它的基本点就在于减少邻近像素之间的空间(或空域)相关性。 信息压缩的可行性 该图为一张俯视图, 图中央的黑色是一块表面均匀的积木块, 在图中, 黑色区域所有点的表示数据差不多都是相同的, 因而黑色区域的数据表达有很大的冗余。 信息压缩的可行性 (2)时间冗余 序列图像和语音数据中包含的冗余。 活动图像(视频)中的两幅相邻图像之间存在的相关性或一段时间内连续音频存在的相关性。 信息压缩的可行性 (3)信息熵冗余 信息熵冗余也称为编码冗余,它是指一块数据所携带的信息量少于数据本身所产生的冗余。例如,利用等长码表示信息就比不等长码如Huffman编码表示信息量存在冗余。 (4)结构冗余 指图象各部分结构上的类似性所产生的冗余,例如物体表面图象上的纹理结构。 信息压缩的可行性 (5)知识冗余 指某些图象的结构可由这些图象的先验知识和背景知识获得。 例:汽车图象的结构可由汽车的先验知识和背景知识得到。这种冗余称为知识冗余。 例: 人脸的图像有固定的结构, 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于正脸图像的中线上等等。 这类规律的结构可由先验知识和背景知识得到, 因此这类信息对一般人来说是冗余信息。 信息压缩的可行性 (6)视觉听觉冗余 视觉听觉冗余是指人的视觉、听觉分辨率低于实际图象、音频的分辨率所产生的冗余。 例如,人的视觉对灰度等级的分辨率是2个等级,而一般图象量化所采用灰度等级是2等级。 例如, 人的视觉对于图像边缘的急剧变化不敏感, 对图像的亮度信息敏感, 对颜色的分辨率较弱等。 因此, 如果图像经压缩或量化发生的变化(或称引入了噪声)不能被视觉所感觉, 则认为图像质量是完好的或是够好的, 即图像压缩并恢复后仍有满意的主观图像质量。 (7) 其他冗余 4. 压缩的种类 无损压缩 也称为冗余压缩或无失真压缩。冗余压缩法去掉或者减少了数据中的冗余,但这些冗余数据是用特定的方法重新插入到数据中。冗余压缩是可逆的,它能保证百分之百地恢复原始数据。 在多媒体技术中,一般用于文本的压缩。但这种方法压缩比较低。常用的压缩编码方法有LZW编码、行程编码、霍夫曼(Huffman)编码等,压缩比一般在2:1~5:1之间。 有损压缩 也称为有失真压缩或熵压缩法。压缩了熵,会减少信息量,而损失的信息量是不能恢复的,因此这种压缩方法是不可逆的。 这种方法适合对图像、声音、动态视频等数据进行压缩,对动态视频的压缩比可达到50:1~200:1。当然,对多媒体数据进行有损压缩后,就涉及到压缩质量的问题,一般的要求是压缩后的内容不应该影响人们对信息的理解。 数据压缩的主要指标 有较高的压缩比、压缩和解压缩时间短、解压缩后信息恢复质量高是评价压缩好坏的主要方面。 1. 有较高的压缩比 即压缩前后的数据量之比,如果文件的大小为1MB,经过压缩处理后变成0.5MB,那么压缩比为2:1。高的压缩比是数据压缩的根本目的,无论从哪个角度看,在同样压缩效果的前提下,数据压缩得越小越好。当然还要考虑多媒体数据压缩后的输入和输出表示方

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档