《基于机器学习的行人检测算法设计案例》3600字.docxVIP

《基于机器学习的行人检测算法设计案例》3600字.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于机器学习的行人检测算法设计案例

目录

TOC\o1-3\h\u21312基于机器学习的行人检测算法设计案例 1

307991.1基于特征的机器学习方法 1

187381.1.1HOG算法 1

23433HOG特征算法流程大致分为几个步骤:图像预处理-梯度计算-构建梯度方向直方图-块内归一化-HOG特征生成(Dadal2005)。 1

15181.1.2SVM 3

207801.2实验方法 3

10541.2.1训练过程 3

44701.2.2分类测试 4

26441.3实验结果与分析 5

170801.1.1实验数据集 5

244481.1.2关键参数选择 5

272641.1.3检测结果 5

1.1基于特征的机器学习方法

现阶段使用最多的行人检测算法是基于机器学习的方法,该方法基本思想是提取目标的特征,并通过大量的训练样本构建行人检测分类器。人体自身的外观、形状具有相对的特殊性,通过人工设计的特征可以将人体与其他物体特征分成两类。人工设计出的人体特征用于训练分类器,该该分类器就能够区分行人和背景。本文采用Dadal在2005年提出的基于HOG+SVM的行人检测算法。HOG(HistogramofOriented)特征是一种针对物体边缘轮廓的特殊特征,其本质是统计部分图像区域的梯度强度和梯度方向来作为该局部图像区域的梯度信息;HOG特征描述子是一种直方图,它以梯度方向作为横坐标、梯度强度值作为纵坐标,用来描述图像局部重叠区域的梯度信息,它通过构建局部区域的梯度方向直方图来构成其HOG特征。HOG特征先计算固定大小的图像的梯度,然后将该图像划分为网格形状,计算每个点处的梯度朝向和强度,然后形成网格内的所有像素的梯度方向分布直方图,最后汇总成整个图像的梯度特征。经过上述步骤得到目标区域的HOG特征后,使用线性支持向量机SVM对该区域进行二分类。

1.1.1HOG算法

HOG特征算法流程大致分为几个步骤:图像预处理-梯度计算-构建梯度方向直方图-块内归一化-HOG特征生成(Dadal2005)。

1)预处理:由于图像的采集环境、采集设备等不同,光照、环境等对检测的准确度影响较大,故需要对采集到的图像进行归一化处理。首先,颜色信息在行人检测中的作用不大,通常将原始图像转化为灰度图。本文采取的图像灰度化方法公式如下:

Gray=

Gray=

(3-1)

在图像亮度不一致的情况下,通过Gamma校正来提高或降低图像整体亮度,能够从图像中提取更准确的特征信息。Gamma校正公式如下:

I(x,y)=

I(x,y)=

(3-2)

式中γ的取值可以自行给出,本文令γ=0.5。

2)计算梯度图:分别在水平和竖直方向对图像进行计算,求得图像梯度和梯度方向。给定水平方向的梯度算子为[?1,0,1],竖直方向的梯度算子为[?1,0,1]T

G

G

3-3)

G

G

(3-4)

式中Gx(x,y)和

G(x,y)=

G(x,y)=

(3-5)

θ

θ

(3-6)

3)计算梯度方向直方图:HOG特征以Cell单元格为最小的结构单位,且其Block块和Win检测窗口都以一个Cell的宽度或高度作为滑动步长,所以我们先将图像划分为若干个8×8像素的Cell单元。Cell单元格中的每个像素点都包含梯度幅值和梯度方向俩个信息,一共128个值;将所有梯度方向划分为9个bin,通过包含9个bin的直方图可以统计每个Cell的梯度信息。为每个Cell创建梯度直方图,直方图横轴即为9个bin,分别对应0°、20°、...、160°;在8×8的Cell上查看每个像素点梯度大小和方向,根据方向权重将该方向上的梯度幅值累加到9个bin上,Cell单元格对应梯度方向直方图的纵轴即每个bin最后累计的梯度值。可以通过一个包含9个值的一维数组表示该直方图。

4)块内归一化:将若干个Cell单元组成一个块Block,HOG特征有3种Block结构,分别为矩形HOG、圆形HOG、中心环绕HOG,本文采用矩形HOG(R-HOG)。将临近的Cell组成一个Block,连接每个Cell的直方图形成一个向量,即得到该Block块内的HOG特征向量。此后还需要对该向量进行归一化处理,一般采用L2-norm方式,其归一化因子表示如下(Dalal2005):

f=

f=

(3-7)

式中v为还未进行归一化的向量,ε的作用是避免公式除以一个为0的值。通过归一化,能进一步抑制光照变化、空间移动等的影响。

5)生成HOG特征向量:组合每个Block的特征向量就能得到最终的HOG特征向量,即HOG特征描述子,用于SVM分类器训练、分类。

1.1

文档评论(0)

02127123006 + 关注
实名认证
文档贡献者

关注原创力文档

1亿VIP精品文档

相关文档