人工智能导论4计算机视觉2019.pptx

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机视觉;计算机视觉;计算机视觉;计算机视觉;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务 ;计算机视觉典型任务;计算机视觉典型任务;计算机视觉;光学图像 Lena; 图像:对客观存在的物体的某种属性的描述。 光学图像: 波长0.38-0.8um 其他波段图像: 伽玛射线:0.003-0.03nm X射线:0.03-3nm 紫外线:3-300nm 红外线:0.8-300um 微波:0.3-100cm 声波图: 如B超 其他: 由感兴趣的物理量转换而成,如密度分布图。 使用图像的通常是人,人约 有80%的信息由视觉获得。 ;什么是图像处理?;图像处理(增强、复原、编码和压缩);图像处理的内容;图像变换: 如付立叶变换、沃尔什变换、离散余弦变换(DCT)等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理。目前小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。;19;2020/7/30;图像增强和复原:;2020/7/30;;2020/7/30;2020/7/30;图像识别;;图像降噪;2020/7/30;2020/7/30;2020/7/30;补充:图像处理基本原理;;2020/7/30;2020/7/30;2020/7/30;;2020/7/30;;2020/7/30;2020/7/30;2020/7/30;2020/7/30;;;;;;;;;计算机视觉;计算机视觉运行原理;计算机视觉运行原理;计算机视觉运行原理;计算机视觉;目标检测原理及模型;目标检测原理及模型;;目标检测原理及模型 ;目标检测原理及模型;目标检测原理及模型;目标检测原理及模型R-CNN;目标检测原理及模型-SPP Net;目标检测原理及模型 -Faster R-CNN ;目标检测原理及模型 -Faster R-CNN ;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-one stage;目标检测原理及模型-YOLO ;一幅图片分成7x7个网格(grid cell),某个物体的中心落在这个网格中此网格就负责预测这个物体。 最后一层输出为 (7*7)*30的维度。每个 1*1*30的维度对应原图7*7个cell中的一个,1*1*30中含有类别预测和bbox坐标预测。 每个网格(1*1*30维度对应原图中的cell)要预测2个bounding box 的坐标(x_{center},y_{center},w,h) ,其中:中心坐标的x_{center},y_{center} 相对于对应的网格归一化到0-1之间,w,h用图像的width和height归一化到0-1之间。 每个bounding box除了要回归自身的位置之外,还要附带预测一个confidence值。 这个confidence代表了所预测的box中含有object的置信度。 每个网格还要预测类别信息,论文中有20类。7x7的网格,每个网格要预测2个 bounding box 和 20个类别概率,输出就是 7x7x(5x2 + 20) 。 (通用公式: SxS个网格,每个网格要预测B个bounding box还要预测C个categories,输出就是S x S x (5*B+C)的一个tensor。 ;缺陷:;目标检测原理及模型-SSD;结构特点;目标检测原理及模型-SSD;与Faster R-CNN对比;优化;计算机视觉;语义分割;图像语义分割;FCN;FCN;FCN;FCN

文档评论(0)

kay5620 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8001056127000014

1亿VIP精品文档

相关文档