多媒体技术5概要.ppt

下载文档 降价啦

0
0
约1.84万字
约 123页
2017-03-14 发布于湖北
举报
版权申诉
保障服务

多媒体技术5概要.ppt

1、本文档共123页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

多媒体技术5概要

§5.3 视频影像的处理和检索 1）基于像素的分割特点：不考虑图像的空间内容分布，只利用各像素的颜色或者灰度信息；最典型算法：直方图阈值——假设图像中对象和背景具有不同的色彩特征，直方图上的峰值代表了对应的对象和背景，通过取峰值之间的阈值可分割出不同对象和背景；问题——易于受噪声影响、阈值的选取很关键；缺点——忽略了像素的空间相关性；对于目标和背景之间色彩差异较小时，不易确定阈值此时可用判别分析法、P尾法、可变阈值法。 §5.3 视频影像的处理和检索 2）基于边缘的分割利用边缘作为不同区域之间的界限检测边缘；利用链接算法把边缘连接成边缘衔接的区域分界线；适合于检测图像的线性特征；缺点在于检测的边缘通常不能形成闭合曲线； §5.3 视频影像的处理和检索 3）基于区域的分割主要根据颜色特征的相似性分割图像为具有一致性的区域：优点——颜色特征具有方向、视角变化、部分遮挡或形状改变等条件下的一致性，比纹理、边缘和形状等特征更稳定；分类：区域增长的分割、区域分裂合并的分割； §5.3 视频影像的处理和检索 4）基于纹理的分割缺少可靠和有效的纹理度量方法，使该方法受到限制；特点：大都认为纹理是在一个图像窗内的特性，能够表示区域内像素值的空间分布情况，能表示区域的光滑度、粗糙度以及规则度等；纹理具有空间结构的特性，或统计特性，或两者兼有。 §5.3 视频影像的处理和检索 5）基于数学形态学的分割基本思想——用具有一定形态的结构元素去度量和提取图像中对应形状；优势：可有效简化图像特征，减少噪声的影响，保持对象的基本形状特性，并去除不相干结构；形态学本身可进行分割；分割步骤：用修正过的开、闭算子进行形态滤波，消除帧内的亮、暗斑，保持物体边界；确定同质区域，同时为区域做标记；以区域标记为种子，用分水岭算法进行区域分割；进行分割质量评价，确定是否需要继续分割。 §5.3 视频影像的处理和检索分水岭算法——一种数学形态学的非线性分割方法，常被用来解决分离相连接的目标；将灰度图像看作是假想的地形表面，每个像素的灰度值表示该点的海拔高度，以图像的梯度作为输入，输出连续的单像素宽度的边缘线；过程：找出输入图像的局部极小值点；水面从极小值点处开始上涨，当不同流域中的水面不断升高到将要汇合在一起时（目标边界处），筑起一道堤坝；得到由这些水坝组成的分水岭线，即完成分割。 §5.3 视频影像的处理和检索 §5.3 视频影像的处理和检索 2、时域分割视频是三维场景在二维平面上的某一个时刻的投影，运动目标与场景有较明显的区别；单纯根据运动信息的均一性来划分区域，估计图像的运动场，将具有相似运动的区域聚类，形成视频对象；基于运动的分割需要解决3个问题：估计运动目标的数目；估计各运动目标的运动特性；估计相应于各运动目标的空间支持，即将运动分割结构向空域投影。 §5.3 视频影像的处理和检索全局运动估计镜头分割确定对象运动估计时空特性对象模型先验知识分割出物体后处理目标提取视频序列运动物体时域分割系统框架 §5.3 视频影像的处理和检索 1）基于检测区域变化的视频分割通过检测序列图像帧上的变化与不变区域，分离运动与静止对象；利用相邻两帧图像的差值检测变化区域，较为简单和易于实现；引起相邻图像之间的差别的情况：物体运动；噪声及光照；不足：当运动物体内部具有大片一致性区域时，运动目标内部被检测为非运动区域，使目标内部出现空洞现象；显露的背景区域被检测为变化部分，误认为是运动目标；运动速度较快时，在相邻两帧间的运动位移较大，导致差分图像中运动变化区域内被覆盖和显露的背景区域较大，使运动目标边界不精确；易于受噪声影响，检测结果易出现孤立点。 §5.3 视频影像的处理和检索 §4.3 视频影像的处理和检索 §5.3 视频影像的处理和检索 2）基于光流场的视频分割估算密度运动场，然后进行场景分割；运动场是三维物体的实际运动在图像平面上的投影，得到的图像亮度随时间的变化，即所谓光流场；光流场是一种求差方法，假设图像中大部分点的亮度是连续的，目标上亮度平滑变化；光流场并不总是对应于运动场，如果光照变化，即使没有运动，光流也能被观察到；具有一致纹理的区域内部亮度是常量，不便于进行差值运算，运动目标或区域必须包含足够的纹理信息，才能得到光流场； §5.3 视频影像的处理和检索 §5.3 视频影像的处理和检索 §5.3 视频影像的处理和检索基本思想：假设有K个相互独立的运动物体；每一个不同的运动可以通过一系列映射参数来正确描述；每一个区