计算机视觉教程 教学课件 作者 章毓晋 CCV14.ppt

计算机视觉教程 教学课件 作者 章毓晋 CCV14.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
14.4.3 新理论框架的研究 3. 计算机视觉的最终目标 人类视觉系统是相当通用的计算机视觉系统。计算机视觉研究的一个重要目标就是要建立能完成各种视觉任务的通用系统 计算机视觉是一个牵涉人类智能的问题。对于许多看起来非常简单的人类智能是否可能在计算机上复现,至今还没有定论 这是一个值得研究和有所作为的领域,有着光明的前景,让我们一起努力吧! 教程作者(章毓晋)联系信息 通信地址:北京清华大学电子工程系 邮政编码:100084 办公地址:清华大学东主楼,9区307室 办公电话:(010 传真号码:(010 电子邮件:zhang-yj@tsinghua.edu.cn 个人主页:oa.ee.tsinghua.edu.cn/~zhangyujin/ (下载更新的讲稿和教程修改表) * 14-* 第14章 计算机视觉教程 章毓晋 第14章 场景解释 14.1 线条图标记解释 14.2 体育比赛视频排序 14.3 计算机视觉系统模型 14.4 计算机视觉理论框架 14.1 线条图标记解释 1. 轮廓标记 在线条图中对轮廓进行标记时的一些名词概念 (1) 刃边 (2) 翼边 (3) 折痕 (4) 痕迹 (5) 阴影 14.1 线条图标记解释 2. 结构推理 三面角点目标,处于常规位置 14.1 线条图标记解释 2. 结构推理 14.1 线条图标记解释 3. 回朔标记 已知2-D线条图中的一组边,要给每条边赋一个标记,以解释3-D的情况 回朔标记法将边排成序列,以深度优先的方式生成通路,依次对每条边进行所有可能的标记,检验新标记与其他边标记的一致性,依次赋给 所有边的标记都满足一致性,则得到一种 标记结果 棱锥4个顶点分别用A,B,C,D表示 14.1 线条图标记解释 14.2 体育比赛视频排序 1. 体育比赛视频的特点 一般均有较强的结构性 总有一些高潮事件 环境是特定的,比赛中有许多不定因素,事件发生的时间位置不能事先确定,所以比赛中无法控制视频生成过程 有关特殊事件的精彩镜头是一大看点 使用先验知识对精彩事件进行定义检测 14.2 体育比赛视频排序 2. 比赛节目的结构(乒乓球比赛) 比赛事件、发球事件、场间休息、观众和重放 将节目中的镜头根据场景进行非监督聚类 14.2 体育比赛视频排序 3. 目标检测和跟踪 基于客观指标 运动员检测 球桌检测 球检测 运动员跟踪 乒乓球跟踪 14.2 体育比赛视频排序 3. 目标检测和跟踪 白线框为运动员外接盒 跟踪得到的乒乓球轨迹 14.2 体育比赛视频排序 4. 精彩度判定和排序 (1) 基本层的排序 球运动的平均速度 连续两次击球间球运动的平均距离 运动员连续两次击球间运动的平均距离 14.2 体育比赛视频排序 4. 精彩度判定和排序 (2) 品质层的排序 运动员移动的激烈程度 球轨迹的品质 击球的变化 14.3 计算机视觉系统模型 14.3.1 多层次串行结构 14.3.2 以知识库为中心的辐 射结构 14.3.3 多模块交叉配合结构 14.3.1 多层次串行结构 将图像理解过程看作是一个信息加工过程,具有确定的输入和输出,因而将图像理解系统组织成一系列分别处于不同层次的模块并以串行方式结合起 来,每个模块(在其他模块的协同配合下)按顺序执行一些特定的工作,从而逐步完成预定的视觉任务 由底向上的处理,比较通用,但不一定总有 效。由顶向下的处理,在约束充分时效率会比较高,反之则不实用 14.3.1 多层次串行结构 14.3.2 以知识库为中心的辐射结构 可以看作是一种类比于人类视觉系统的结构。它的特点是以知识为中心,系统整体不分层,信号在各个模块及知识库中多次进行交换处理 14.3.3 多模块交叉配合结构 将整个系统分成多个模块,各有确定的输入和输出,且互相配合交叉,比较灵活 一个图,其中每个结点代表一个加工过程或加工任务,而结点间的连接则反映了信息的流动和过程的联系 本书的整体框架,即本书所采用的计算机视觉系统框架是对上述多模块交叉配合结构的系统框图根据教学需求经过调整而得到的 14.3.3 多模块交叉配合结构 14.4 计算机视觉理论框架 14.4.1 马尔视觉计算理论 14.4.2 对马尔理论框架的改进 14.4.3 新理论框架的研究 14.4.1 马尔视觉计算理论 1. 视觉是一个复杂的信息加工过程 要解决两个问题。一个是视觉信息的表达问 题,

文档评论(0)

时间加速器 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档