- 1
- 0
- 约6.28千字
- 约 4页
- 2023-10-10 发布于上海
- 举报
计算机视觉综述
计算机视觉⼊门系列(⼀) 综述
⾃⼤⼆下学期以来,学习计算机视觉及机器学习⽅⾯的各种课程和论⽂,也亲⾝参与了⼀些项⽬,回想起来求学过程中难免⾛了不少弯路和
坎坷,⾄今⽅才敢说堪堪⼊门。因此准备写⼀个计算机视觉⽅⾯的⼊门⽂章,⼀来是时间长了以后为了巩固和温习⼀下所学,另⼀⽅⾯也希
望能给新⼊门的同学们介绍⼀些经验,还有⾃然是希望各位⽜⼈能够批评指正不吝赐教。由于临近⼤四毕业,更新的时间难以保证,这个系
列除了在理论上⾯会有⼀些介绍以外,也会提供⼏个⼩项⽬进⾏实践,我会尽可能不断更新下去。
因诸多学术理论及概念的原始论⽂都发表在英⽂期刊上,因此在尽可能将专业术语翻译成中⽂的情况下,都会在括号内保留其原始的英⽂短
语以供参考。
⽬录
简介
⽅向
热点
简介
计算机视觉(Computer Vision)⼜称为机器视觉(Machine Vision),顾名思义是⼀门 “教”会计算机如何去“看”世界的学科。在机
器学习⼤热的前景之下,计算机视觉与⾃然语⾔处理(Natural Language Process, NLP)及语⾳识别 (Speech Recognition)并列为
机器学习⽅向的三⼤热点⽅向。⽽计算机视觉也由诸如梯度⽅向直⽅图 (Histogram of Gradient, HOG)以及尺度不变特征变换
(Scale-Invariant Feature Transform, SIFT)等传统的⼿办特征 (Hand-Crafted Feature)与浅层模型的组合逐渐转向了以卷积神经
⽹络 (Convolutional Neural Network, CNN)为代表的深度学习模型。
⽅式 特征提取 决策模型
传统⽅式 SIFT,HOG, Raw Pixel … SVM, Random Forest, Linear Regression …
深度学习 CNN … CNN …
svm(Support Vector Machine) : ⽀持向量机
Random Forest : 随机森林
Linear Regression : 线性回归
Raw Pixel : 原始像素
传统的计算机视觉对待问题的解决⽅案基本上都是遵循: 图像预处理 → 提取特征 → 建⽴模型 (分类器/回归器) → 输出 的流程。 ⽽在
深度学习中,⼤多问题都会采⽤端到端 (End to End)的解决思路,即从输⼊到输出⼀⽓呵成。本次计算机视觉的⼊门系列,将会从浅层
学习⼊⼿,由浅⼊深过渡到深度学习⽅⾯。
⽅ 向
计算机视觉本⾝⼜包括了诸多不同的研究⽅向,⽐较基础和热门的⼏个⽅向主要包括了:物体识别和检测 (Object Detection),语义分割
(Semantic Segmentation),运动和跟踪 (Motion Tracking),三维重建 (3D Reconstruction),视觉问答 (Visual Question
Answering),动作识别 (Action Recognition)等。
物体识别和检测
物体检测⼀直是计算机视觉中⾮常基础且重要的⼀个研究⽅向,⼤多数新的算法或深度学习⽹络结构都⾸先在物体检测中得以应⽤如VGG-
net, GoogLeNet, ResNet等等,每年在imagenet数据集上⾯都不断有新的算法涌现,⼀次次突破历史,创下新的记录,⽽这些新的算
法或⽹络结构很快就会成为这⼀年的热点,并被改进应⽤到计算机视觉中的其它应⽤中去,可以说很多灌⽔的⽂章也应运⽽⽣。
物体识别和检测,顾名思义,即给定⼀张输⼊图⽚,算法能够⾃动找出图⽚中的常见物体,并将其所属类别及位置输出出来。当然也就衍⽣
出了诸如⼈脸检测(Face Detection),车辆检测(Viechle Detection)等细分类的检测算法。
近年代表论⽂
1. He, Kaiming, et al. “.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.
2. Liu, Wei, et al. “.” European Conference on Computer Vision. Springer International Publishing, 2016.
3
原创力文档

文档评论(0)