人工智能导论4计算机视觉2019.pptx

下载文档 降价啦

10
0
约1.85千字
约 97页
2021-08-01 发布于四川
举报
版权申诉
保障服务

人工智能导论4计算机视觉2019.pptx

1、本文档共97页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

计算机视觉;计算机视觉;计算机视觉;计算机视觉;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务;计算机视觉典型任务;计算机视觉;光学图像 Lena; 图像：对客观存在的物体的某种属性的描述。光学图像：波长0.38-0.8um 其他波段图像：伽玛射线：0.003-0.03nm X射线：0.03-3nm 紫外线：3-300nm 红外线：0.8-300um 微波：0.3-100cm 声波图：如B超其他：由感兴趣的物理量转换而成，如密度分布图。使用图像的通常是人，人约有80％的信息由视觉获得。 ;什么是图像处理？;图像处理(增强、复原、编码和压缩);图像处理的内容;图像变换: 如付立叶变换、沃尔什变换、离散余弦变换（DCT）等间接处理技术，将空间域的处理转换为变换域处理，不仅可减少计算量，而且可获得更有效的处理。目前小波变换在时域和频域中都具有良好的局部化特性，它在图像处理中也有着广泛而有效的应用。;19;2020/7/30;图像增强和复原：;2020/7/30;;2020/7/30;2020/7/30;图像识别;;图像降噪;2020/7/30;2020/7/30;2020/7/30;补充：图像处理基本原理;;2020/7/30;2020/7/30;2020/7/30;;2020/7/30;;2020/7/30;2020/7/30;2020/7/30;2020/7/30;;;;;;;;;计算机视觉;计算机视觉运行原理;计算机视觉运行原理;计算机视觉运行原理;计算机视觉;目标检测原理及模型;目标检测原理及模型;;目标检测原理及模型;目标检测原理及模型;目标检测原理及模型;目标检测原理及模型R-CNN;目标检测原理及模型-SPP Net;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-Faster R-CNN;Faster R-CNN;目标检测原理及模型-Faster R-CNN;目标检测原理及模型-one stage;目标检测原理及模型-YOLO;一幅图片分成7x7个网格(grid cell)，某个物体的中心落在这个网格中此网格就负责预测这个物体。最后一层输出为（7*7）*30的维度。每个 1*1*30的维度对应原图7*7个cell中的一个，1*1*30中含有类别预测和bbox坐标预测。每个网格（1*1*30维度对应原图中的cell）要预测2个bounding box 的坐标（x_{center},y_{center},w,h），其中：中心坐标的x_{center},y_{center} 相对于对应的网格归一化到0-1之间，w,h用图像的width和height归一化到0-1之间。每个bounding box除了要回归自身的位置之外，还要附带预测一个confidence值。这个confidence代表了所预测的box中含有object的置信度。每个网格还要预测类别信息，论文中有20类。7x7的网格，每个网格要预测2个 bounding box 和 20个类别概率，输出就是 7x7x(5x2 + 20) 。 (通用公式： SxS个网格，每个网格要预测B个bounding box还要预测C个categories，输出就是S x S x (5*B+C)的一个tensor。 ;缺陷：;目标检测原理及模型-SSD;结构特点;目标检测原理及模型-SSD;与Faster R-CNN对比;优化;计算机视觉;语义分割;图像语义分割;FCN;FCN;FCN;FCN