- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华 中科 技大学
华 中
科 技
大
学 硕
士
学 位
论
文
PAGE 10
PAGE 10
1 绪 论
1.1 研究背景和意义
数字图像处理也称为计算机图像处理,它是一种将图像信号用数字信号来表示, 并且利用计算机进行处理的过程。数字图像处理出现在 20 世纪 50 年代,最早的图
形处理其主要目的是改善图像的质量,人是对象。美国的喷气推进实验室首次成功 在数字图像处理方面获得实际应用[1],20 世纪 70 年代英国 EMI 公司将图像处理技术 应用于医学,研制出了计算机断层摄影装置 CT(Computer Tomography)。该技术获
得了诺贝尔医学奖,在人类史上具有重大意义[2]。之后,随着计算机技术,人工智能, 模式识别等技术的快速发展,以及视觉计算理论的完善[3],数字图像技术变得不再仅
仅局限于图像的改善,而开始向更深层,更高的层次发展,其应用的领域也不断地 开始扩大。
随着计算机技术的快速发展,因特网的迅速普及,计算机正在经历一场网络化的
革命。在计算机不断向网络化发展的同时,人类获取信息的主要方式也发生着改变, 多媒体信息已经成为人们信息获取中不可或缺的主要组成部分。生活中,感知尤其
是视觉感知是人们来获取所需信息的主要途径,大家通过视觉分析系统从获取的海 量数据中提取对其感兴趣的信息,并指导其分析判断。人类获取的信息中绝大多数 来自于视觉,视频也是人们从已知世界中获得的重要的动态信息。视频信息具有良 好的直观性和易接受性,因而在多媒体信息中它倍受青睐,具有重要的地位;不过 视频数据的冗余度非常大,含有许多人们并不感兴趣信息,因而,在多媒体服务中 经压缩处理后的视频质量高低直接决定了其服务的好坏。如何将海量的多媒体数据 进行压缩传输,成为了人们有效获取信息的障碍。与此同时,数字图像技术的飞速 发展和应用领域的不断扩展,使得高效的多媒体数据压缩编码成为一种迫切的需求 [4]。因而,在信息技术的应用领域,作为多媒体核心技术的数字视频技术,对于有效 压缩编码的研究,成为全球学者研究的一个热门话题。
视频压缩的传统理论以香农定理为基础,辅以经典的集合论,用统计思想来建立
概率模型来描述视频信息。这种方式很好的解决了信息量的问题,但是却忽略了信
息本身特征的具体表现及其含义,同时也没有考虑到信息接收者的主观特性(对信息 需求者的主观要求)。整个视频编码发展的历程也是在香农理论的基础上,在后来人 不断思维创新和进步中不断完善,提高的过程。
MPEG-4 作为 新 一 代 基 于 内 容 的 多 媒 体 数 据 压 缩 编 码 国 际 标 准 [5] , 是 由 MPEG(Moving Picture Experts Group)开发的一个 ISO/IEC 标准。它以基于内容编码为 其主要特点,在提供强大有效地压缩编码的能力的同时,还提供一个以视频对象为 基础的交互,使得用户能方便操作视频中所感兴趣对象,扩展了应用范围。MPEG-4 标准第一次提出了基于对象的视频编码的新理念,打破了视频编码中的传统思维, 这也是两者间的最大不同之处。同时,作为其标准的核心思想理念的交互部分,它 采用了开放式接口,仅仅提出了以视频对象为基础,却并不指定分割的策略,由用
户根据自己的实际需要去设计分割对象的策略[6]。这种开放式的思想能够很好的促进 视频编码技术的发展和应用,具有重要的意义。
为了进一步理解 MPEG-4 的思想,我们引入两个概念:视频对象和视频对象平面。 视频对象是指具有生命周期且时间上连续的一个对象,是时间与空间平面的三维空
间概念。对视频序列中运动对象的分割则是指把其中对于自己感兴趣的某个或者多 个运动物体,从场景中提取出来,这多个物体间的属性具有某些方面的相同点,例 如色彩,亮度,运动,位置等。视频对象平面是指在某一时刻对视频对象在空间平 面的采样,它是新一代编码中的一个核心的概念。MPEG-4 的主要理念是在对视频编 码的过程中,不采用固定的策略,针对不同的 VO(Video Object),采用适合的策略去 安排编码,把前景视频对象的细节特征和边缘平滑性在压缩编码里尽可能的保留; 同时对于背景视频对象的编码采用尽可能高的压缩策略,在某些场合甚至可以直接 将其丢弃,由解码端来利用其它背景对象合成。新一代的基于视频对象的编码方式 在克服传统视频编码由高压缩率编码所带来的方块效应的同时,更方便了用户同场 景间的交互。这使得基于此的编码方法不仅在实际应用时能提高数据压缩比,同时 也满足了人们对视频对象的人机交互需求,给视频编码的发展开拓了广阔的发展前 景。
视频对象分割基于较高级的语义,这使得它更接近于人类的思维表达方式,在应
用时更直观,也更加方便,更利于被接受。它需要人们对视频对象的内容进行分析 和理解,
您可能关注的文档
- 基于颜色特征的视觉移动机器人目标跟踪系统-机械电子工程专业论文.docx
- 基于客户满意度的宽带装移维的服务提升-工商管理专业论文.docx
- 基于区域综合特征的图像检索-计算机应用技术专业论文.docx
- 基于身份认证的网络考试系统安全模型研究-计算机软件与理论专业论文.docx
- 基于音乐分类的哼唱检索分析-计算机应用技术专业论文.docx
- 基于系统动力学的铝型材项目经济评价-管理科学与工程专业论文.docx
- 基于数据挖掘的故障诊断方法分析-电力系统及其自动化专业论文.docx
- 基于数据仓库的库存管理与分析系统研究与开发-计算机技术专业论文.docx
- 基于图割与水平集的超声图像分割方法研究-电子与通信工程专业论文.docx
- 基于可持续发展战略下的绿色设计政策制定与实施经验研究-艺术学理论专业论文.docx
- 基于输入输出数据的非线性系统建模与实验-控制理论与控制工程专业论文.docx
- 基于说话人识别技术的身份认证系统-电路与系统专业论文.docx
- 基于手写病人信息查询系统设计-机械制造及其自动化专业论文.docx
- 基于损伤理论的混凝土抗冻耐久性研究-结构工程专业论文.docx
- 基于胜任力的公共安全管理培训系统研究-企业管理专业论文.docx
- 基于无线传感器网络的动态应力测量系统研究-计算机科学与技术专业论文.docx
- 基于碳效益的机械产品多工艺低碳制造决策模型及应用-机械制造及其自动化专业论文.docx
- 基于内存热插拔的虚拟机动态内存管理系统-计算机系统结构专业论文.docx
- 基于陷阱集本体论的 LDPC 译码算法研究-计算机系统结构专业论文.docx
- 基于时间序列分析的无线传感器网络数据融合算法研究-计算机应用技术专业论文.docx
原创力文档


文档评论(0)