- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机视觉01教材课程.ppt
计算机视觉 computer vision;主讲: 曹洋 博士
forrest@ustc.edu.cn
办公室:科技楼西楼303
电话Office)
Mobile)
;助教: 李贤
shysian@mail.ustc.edu.cn
实验室:科技楼西楼316
电话Lab)
;使用教材:
Richard Szeliski,Computer Vision: Algorithms and Applications,Springer,2010
参考教材:
David A. Forsyth, Jean Ponce著,计算机视觉(一种现代方法),电子工业出版社 2004。
课程主页:
;课程设置;课程设置:;Schedule;4.17
(3 lectures);考核方式;第一章 绪论;视;智能机器:能够模拟人类的功能,感知外部世界并有效解决人所能解决问题的系统。
在人类的感知器官中,视觉获取的信息量最大,大约80%,因此对于发展智能机器而言,赋予机器以人类视觉功能是十分重要的。
计算机视觉:研究用计算机来模拟生物外显或宏观视觉功能的技术学科。
计算机视觉的任务是用图像创建或恢复现实世界模型,然后认知现实世界。
具体来说,让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。 ;;;;;;;计算机视觉过程;分为三个阶段
特征提取和区域分割
基于轮廓,纹理,颜色…
建模与模式表达
基于各种物体的抽象化模型
描述和理解
基于景物的结构知识;输入设备(input device)的研制,包括成像设备和数字化设备.成象设备是指通过光学摄像机或红外、激光、超声、X射线对周围场景或物体进行探测成象,得到关于场景或物体的二维或三维数字化图像.
对输入的原始图像进行预处理.这一过程借用了大量的图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条、边界以及色彩等关于场景的基本特征;这一过程还包含了各种图像变换(如校正)、图像纹理检测、图像运动检测等.
;恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息,并在此基础上恢复物体的完整三维图,建立物体三维描述.
根据机器预先存贮的模型知识以及形状、色彩等特征,对于图像中各种物体进行识别,确定它们用于哪一类物体.
建立各个图像中物体的拓扑关系图,给出图像所反映景物??结构描述.
体系结构(system architecture),涉及一系列相关的课题,并行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径.
;图像多义性: 三维场景被投影为二维图像,深度和不可见部分的信息被丢失,因而会出现不同形状的三维物体投影在图像平面上产生相同图像的问题.另外,在不同角度获取同一物体的图像会有很大的差异.
环境因素影响:场景中的诸多因素,包括照明、物体形状、表面颜色、摄像机以及空间关系变化都会对成像有影响.
知识导引: 同样的图像在不同的知识导引下,将会产生不同的识别结果.
大量数据: 灰度图像,彩色图像,深度图像的信息量十分巨大,巨大的数据量需要很大的存贮空间,同时不易实现快速处理.;上世纪50年代,从统计模式识别开始,主要集中在二维图像分析与识别,主要应用包括字符识别、工件表面检测等等。
上世纪60年代,拓展到三维结构,对物体的形状,物体的空间关系进行描述。通过对积木世界的研究,引出了边缘、角点等特征提取,图像明暗、纹理、运动以及成像几何等研究工作。
上世纪70年代,Marr计算视觉理论,建立一个十分重要的理论框架。;;5.计算机视觉的发展(1970s);5.计算机视觉的发展(1980s);Marr视觉计算理论——三种层次
计算理论,主要解决视觉系统的计算目的和策略是什么?输入输出是什么?用什么策略根据系统的输入求出输出?该层次的任务就是研究如何建立输入输出之间的约束和关系。
表示和算法,解决输入输出信息如何来表示?如何实现计算理论所对应的功能的算法?以及如何由一种表示转换成另一种表示?
硬件实现,就是具体的计算装置和一些细节配置;5.计算机视觉的发展(1990s);5.计算机视觉的发展(2000s);图像处理:图像处理通常是把一幅图像变换成另外一幅图像,也就是说,图像处理系统的输入是图像,输出仍然是图像,信息恢复任务则留给人来完成
计算机图形学:通过几何基元,如线、圆和自由曲面,来生成图像,它在可视化(Visualization)和虚拟现实(Virtual Reality)中起着很重要的作用.计算机视觉正好是解决相反的问题,即从图像中估计几何基元和其
文档评论(0)