- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章 绪论(v).ppt
第一章 绪论 1.1 计算机视觉 1、什么是视觉 视觉是一个从图象发现外部世界中有什么物体和物体在什么地方的过程,也就是产生对观察者有用的描述。 从输入的图象到对外部世界的描述之间存在巨大的间隔。 视觉是一系列的信息处理任务。 2、人自身体力--》机械化--》自动化(智能机器)--》计算机视觉(机器视觉)。 3、计算机视觉是研究用计算机来模拟生物视觉或宏观视觉功能的科学和技术。即用各种成象系统代替视觉器官作为输入敏感手段,用计算机代替大脑完成处理和解释,为计算机和机器人开发具有类似人类的视觉能力。 4、计算机视觉研究的核心问题---从景物图象或序列图象求出景物的精确的三维几何描述,并定量地确定景物中物体的空间性质。(Shape from X) 5、计算机视觉的发展:从统计模式识别(二维图象分析和识别)--》Roberts对积木世界的研究--》Marr的视觉计算理论。 6、新理论、新方法:如,基于感知特征群的物体识别理论框架、主动视觉理论框架、视觉集成理论框架等。 7、计算机视觉的重要性 使计算机向人靠拢。 使机器人具有人具有的适应环境和自主决策的能力。 8、计算机视觉是人工智能的一个分支,是一门综合性的学科,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。 9、另外,了解生物(人类)视觉器官的构成及信息处理过程,对计算机视觉的研究非常具有启发性和指导意义。 至今,计算机视觉仍是一个非常活跃的研究领域。与该领域有关的有很多国际会议、期刊及学术专著等。 1.2 Marr的视觉计算理论 Marr 的视觉计算理论[Marr1982]立足于计算机科学,系统地概括了心理生理学、神经生理学等方面业已取得的所有重要成果,是视觉研究中迄今为止最为完善的视觉理论。 Marr 建立的视觉计算理论,使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉研究的发展。人们普遍认为,计算机视觉这门学科的形成与Marr的视觉理论有着密切的关系。 1、Marr的视觉计算理论 视觉是信息处理过程 基于重构的视觉处理方法 描述是由不同层次的表象(representation)组成 三个层次的表象 2、Marr视觉计算理论的三个层次 (1)计算理论 (2)算法与数据结构 (3)硬件实现 3、视觉表示框架 (1)第一阶段:“要素图”或“基元图” (2)第二阶段:对环境的2.5维描述 (3)第三阶段:三维模型表示 Marr 视觉理论的不足 Marr的视觉计算理论是计算机视觉研究领域的划时代成就,但该理论不是十分完善的,许多方面还有争议。比如, 该理论所建立的视觉处理框架基本上是自下而上,没有反馈。 还有,该理论没有足够地重视知识的应用。尽管如此,Marr理论给了我们研究计算机视觉许多珍贵的哲学思想和研究方法,同时也给计算机视觉研究领域创造了许多研究起点。 1.3 计算机视觉的应用 1、零件识别与定位 2、产品检验 3、移动机器人导航 4、遥感图象分析 5、医学图象分析 6、安全鉴别、监视与跟踪 7、国防系统 8、其它 人机交互(接口)无所不在使计算机视觉在人机交互系统中的应用越来越重要。 (计算机,通信的无所不在,使人机交互无所不在)。 人机交互 人脸的检测、跟踪、识别 人脸建模和动画,虚拟人像(Avatar) 人体检测和跟踪 手势识别 事件的检测和识别 与人机交互相关的领域 基于内容的信息检索 视觉监控 (visual surveillance) 基于对象的视频压缩 Biometric Recognition 基于数字图象处理的炉膛火焰检测技术 1、传统火焰检测方法的主要缺点: 视场小。当煤种变化或负荷变化引起着火位置漂移时,将严重影响检测效果。 只能给出有无火焰的开关量信号。 抗干扰能力差。 2、基于数字图象处理火焰检测技术的功能: 视场大(传像光纤的视角可达80°)。 应用边缘检测和图象分割技术,对火焰图像进行处理,可进一步分析炉膛火焰的燃烧状况,估算出有关参数。 火焰温度场 锅炉空气动力场试验应用 1 .4 计算机视觉的研究内容 与面临的困难 1、计算机视觉研究的主要内容 (1)输入设备 (2)低层视觉 (3)中层视觉 (4)高层视觉 (5)体系结构 2、计算机视觉面临的困难 (1)图象的多义性 (2)环境因素影响 (3)知识导引 (4)大量数据 1 .4 计算机视觉与其它学科的关系 1、图象处理 2、计算机图形学 3、模式识别 4、人工智能 5、人工神经网络 6、神经物理学与认知科学 计算机视觉研究对策 研
文档评论(0)