- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算理论层 算法与表示层 物理实现层
汁算的目的; 计算的实现方法: 算法与表示在物
计算的合理性与 计算输入输出的 理设各上的实现
正确性; 表现形式; 方法
计算的策略与有 不同表现形式之
效性: 间的转换
表l 计算机视觉研究的三个层次
按照Marr的理论,计算理论层的日的是回答计算的目的和策略是什么;并
定义其输入和输出的内容。事实上,该层次是建立一种信息(输入)到另一种信
息(输出)之间的映射过程。例如从灰度图像到三维场景;从形状的二值剪影图
像到形状的类别等等。该层次定义了如何从二维的图像得到物体本身的信息。
算法与表示层进一步定义了如何表示输入和输出信息,例如输入究竟是灰度
点阵图像还是二值化的点阵图像、输出是特征向量、有向图或是表示位置的坐标
信息等等。该层次还应定义建立从输入到输出的映射的具体方法,比如使用何种
数据结构和符号表示等。一般来说,不同的输入输出及计算理论对应不同的表示,
而同一种计算理论也可以对应若干种不同的表示。
硬件实现层的任务是用具体的硬件(包括软件或应用程序)来实现上述的表
示和算法。LP,女n使用何种输入设备(数码相机、摄像机、图片扫描仪等)、在何
种硬件平台上进行计算等等。
上述三个层次之间有着逻辑上的因果联系,但应当看到,它们之间的联系并
不是非常紧密的。因此,真实视觉系统中的某些问题只能在其中的一个或两个层
次上来解释。例如神经科学通常与第三个层次相关联,神经细胞之间的突触机制、
动作电位、抑制性相互作用等都在第三个层次上(当然,这里把人脑中的神经元
也视作广义上的硬件);另一方面,视觉心理学的内容与第二层次的联系更为紧
密。
从过程上讲,Man把视觉系统的工作分为三个阶段:第一阶段(早期阶段)
是将输入的原始图像进行处理,抽取一些基本特征(拐点、角、边界、线条、纹
理等)。这些基本特征称为基元(Primitive
Sketch)。第二阶段(中期)的工作是
在以观测者为中心的坐标系中通过输入图像和基元恢复场景可见部分的深度、法
线方向、轮廓等信息。第二阶段获取的内容已经包括了部分深度信息,但并非物
体真正的三维表示。第三阶段(后期)的任务是通过第一和第二阶段所得到的信
息恢复整个三维场景并对其中的物体进行表示或识别。
Marr的理沧是计算机视觉领域的重大成就,但其本身还存在~些不完善的地
方。例如,该理论所提出的视觉系统工作框架基本是自上而下的,两个阶段之间
并没有反馈过程:先验知识的作用也没有被考虑。然而,他关于视觉系统的分析
和定义仍然为基期视觉领域的研究提供了起点。
1.5 形状分析
1.2.1 形状分析方法的作用与分类
尽管机器视觉领域的研究发展得非常迅速,但其基本的过程仍是从场景图像
中获取信息。机器视觉系统所获取的场景图像一般都是灰度图像,也就是三维场
景在二维平面上的投影。场景一般由各种具有不同大小和形状的物体组成,从图
像恢复现实世界模型的过程也就是分离与识别场景中物体的过程。因此,物体的
识别是机器视觉领域的一个基本问题。物体的视觉特征包括形状、大小、纹理、
光照等等,其中形状是非常重要的一种特征,也是本文所研究的对象。物体的形
状是黑白的二维图像,可以看成由无限远的点光源照射物体而形成的投影。物体
的形状虽然不包含亮度、纹理等信息,但刻画了物体的轮廓特征,确定了物体的
边界。因此,有效地分析物体的形状是准确识别物体的重要条件,因而也是机器
视觉系统能够有效工作的重要前提。
形状分析是从图像中提取形状的特征信息,存储于特定的数据结构中,并用
于比较、识别、分类、榆索等操作的过程。由不同的形状中提取的特征信息应当
具有同样的形式,以便互相比较。形状分析方法的输入是包含物体形状信息的平
面图像(如何从灰度场景图像中提取黑白的形状图像并非形状分析系统的职责),
其输出为表达形状特征的某种数据结构。
按照形状分析方法的输出形式,一般能够将它们分成两类:输出非数值信息
的方法与输出数值信息的方法『41。
前一类形状分析方法方法的输出是非数值结构,例如树、无向图等,这些输
出结构保存了形状的重要特
文档评论(0)