计算机软件及应用计算机视觉Chapter.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
computer vision 计算机视觉 王 宾 西北大学信息学院 2006 计算机视觉 图像处理--〉图像分析--〉图像理解 边缘、轮廓、纹理、颜色、二值图像、深度、二维、三维、运动、跟踪、识别、生物特征识别…… 直方图、彩色表示、数据结构、预处理、分割、特征表示、统计或结构模式识别、神经网络、模糊系统、人工智能、数学形态学、离散线性变换、图像数据压缩、光流、最小均方误差滤波器…… 第一章 计算机视觉概述 1.1 什么是计算机视觉 1.2 人类视觉 1.3 视觉的计算理论 1.4 计算机视觉的研究内容与问题 1.5 计算机视觉的应用领域 1.6 计算机视觉与人类视觉的关系 1.7 成像几何基础 第一章 计算机视觉概述 1.1 什么是计算机视觉 使计算机具有像人那样的视觉功能 人类的各种感官系统中,视觉信息占到人类能获取信息量的80%。 计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要对图像信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起 是人工智能的一个分支 是重大挑战(grand challenge) 将对国民经济和国防建设各方面产生重大影响 计算机视觉是一门综合性的学科 其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经心理学和认知科学等 计算机视觉应用与发展 工业自动化 非接触性工件校验和质量控制 在线检测(钻孔、尺寸、产品质量) 机器人导引 移动机器人导航 装配机器人的工件获取和安放 人机交互(接口)无所不在 计算机通信的无所不在,使人机交互无所不在 (人的各种生物特征) 人机交互 人脸的检测、定位、跟踪、识别 人脸建模和动画,虚拟人像 人体运动检测和跟踪 手势识别(Ok…) 事件的检测和识别(人在做什么,有什么事发生) 与人机交互相关的领域 基于内容的信息检索 视频监控 (visual surveillance) 基于对象的视频压缩 游戏、娱乐 生物特征识别(Biometric Recognition) 多模态生物特征融合 音视频特征关联模型 多模态生物特征数据库 多层级融合策略与框架 生物特征鉴别平台 Face Detection Face Tracking Face Detection: 在输入图象中确定所有人脸的位置、大小、姿态 Face Tracking: 在输入图象序列中确定某个人脸的运动轨迹及大小变化 Motion Object Tracking Face Modeling Face Animation Face Modeling是根据各种输入(尤其是二维图象)创建三维动画人脸的过程 Face Animation是在动画流参数、文本输入、以及特定人动画视频的驱动下使人脸模型进行动画的过程 Talking Head 可视语音指与语音相伴的可视发音器官状态。可视语音合成需要人脸模型及变化过程。 参数控制的可视语音合成系统中,关键是建立一个能够有效描述发音器官运动规律的视位模型,生成逼真的动态视位参数; 数据驱动的可视语音合成系统中,关键是针对复杂的协同发音环境建立合理的相似性度量准则,并从多个角度考虑选择最佳的视位图像样本。 Hand Gestures Application 标准工件尺寸测量 1.2 人类视觉 视觉是人类最重要的感觉 敏感 (sensation)-感觉 ( perception)-认知(cognition) 感觉是人的大脑与周围世界联系的窗口 人类认识外界信息的80%来自视觉 视觉在各种感觉中占支配地位 视觉是思维的一种最基本的工具 视觉和听觉中的形状,色彩,运动,声音被结合成各种明确的和高度复杂,多样化的空间和时间的组织结构.为理智活动提供了媒介和环境 形象思维,心理意象,记忆 1.2 人类视觉 视觉是复杂的信息处理过程 视觉中的各种恒常性: 大小,亮度和颜色,运动恒常性 视觉思维 视觉器官——眼睛接受外界的刺激信息,而大脑对这些信息通过复杂的机理进行处理和解释使这些刺激信息具有明确的物理意义 人类视觉的特殊性 人类视觉的特殊性 人类视觉的特殊性 1.3 视觉的计算理论 Roberts视觉理论 积木世界 马尔 (Marr)的视觉计算理论 Marr视觉理论的地位 Marr视觉理论的三个层次 视觉表示框架 1.3.1 Roberts视觉理论 Roberts视觉理论(积木世界) 20世纪60年代,Roberts通过程序从图像中提取出了诸如立方体、锲形体、棱柱体等三维结构。 对物体形状及物体的空间关系进行了描述 开创了以理解三维场景为目的的三维机器视觉 由这些基本元素构成的三维场景犹如积木一样,故称为积木世界 后来,推广到线条、平面、曲面等几何要素的分析

文档评论(0)

2837587390 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档