- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于视觉注意机制的行人检测方法.doc
基于视觉注意机制的行人检测方法 【摘 要】视觉注意机制是人类视觉信息处理过程中的一项极为重要的心理调节机制,将注意机制融入到行人检测中,提出一种基于视觉注意机制的行人检测方法。利用注意模型提取颜色、亮度、形状等多种特征,生成显著图,再利用WTA 网络提取感兴趣区域,即行人检测区域;采用HOG作为特征对行人检测区域进行行人检测,该方法首先利用在梯度方向提取人体目标的特征集, 运用支持向量机训练得到一个SVM行人分类器, 最后通过Opencv平台应用到视频行人检测系统中。实验结果表明, 相比较HOG检测方法具有较高的准确率和实时性,该方法对天气和光照变化都有很强的适应能力。 【关键词】注意机制;HOG;SVM;WTA 0 引言 行人检测是智能交通和驾驶辅助系统的重要组成部分。快速准确的检测行人可以辅助司机提高行车安全,或者为智能车辆实现安全驾驶和自主导航提供关键技术,因此,这个课题近年来备受关注。 基于视觉的行人检测方法可以分为三大类:基于模板型、基于模型与基于学习型。基于模板型是以确定人体模板作为匹配初始条件,但人体的模板求解比较复杂;基于模型是采用建立好的模板在图像上进行匹配,从而完成车辆检测,该算法容易受光线变化、行人的姿态变化的影响,并对模板依赖较大,而且行人的姿态太多,统一建模困难;基于学习型的方法是通过提取人体的各种特征,然后利用模式识别的方法进行分类,其中基于梯度方向直方图( Histogr am of Oriented Gradient, 简称HOG)的特征描述行人的方法最为主流,但是提取的人体特征向量维数较大,使得计算量较大,严重影响了实时性,加上线性SVM作为弱分类器进行级联训练,虽然节省了时间,但需要在整个图像区域匹配,影响了实时性与精确性。 针对以上的不足,本文引入了视觉注意机制,将模拟人类视觉注意机制的目标检测方法引入到行人检测中。在传统的注意模型[1]中加入形状特征描述,提取颜色、亮度和形状等特征[2],将各个特征通过一定的特征合并策略将各注意图合并成一张显著图,以定位出行人检测区域。然后在行人检测区域利用行人训练得到的分类器进行检测。 1 基于注意机制的检测模型 人类视觉系统指导注意力分配的因素[3]有两个:自底而上的注意和自上而下的注意。其中,自下而上的注意,也称为数据驱动的注意选择,是最具代表性的是基于特征整合理论的显著性检测模型。 该模型的基本思想是,输入一幅图像,通过线性滤波提取视觉特征中的亮度、颜色和方向三种特征,通过边缘检测得到的边缘图形成对应的形状注意图,在多种尺度下通过高斯金字塔、中央周边差和归一化处理,形成相对应的亮度特征图、颜色特征图和方向特征图。这些特征图先经过特征内部的竞争,形成颜色、亮度、方向的关注图,然后通过特征之间合并生成最终的显著图,再经过生物学中赢者取全WTA(Winners Take All)网络,提取行人检测区域。 自底向上的数据驱动模式采用的是Saliency Tool 模型。设r、g、b 分别对应于输入图像的红、绿、蓝信道,于是可得灰度图L (r+g+b)/3,及高斯金字塔I(σ)。为了从强度中分离出色度信号,使用I 来归一化r、g、b 信道。因为亮度非常低的色度变化是觉察不到的,所以归一化仅在灰度大于全图最大的1/10 位置上进行,而其他位置的r、g、b 值则被赋为0。 归一化后建立4个宽调谐的颜色通道:红色R r-(g+b)/2,绿色G g-(r+b)/2,蓝色B b-(g+r)/2和黄色Y (g+r)/2-|r-g|/2-b,负值则置为0。进一步根据这些颜色通道可建立4个高斯金字塔,可得具有方向选择性的实Gabor 金字塔O(σ,θ)。 考虑3种特征,亮度、颜色和朝向。若中央周边差操作为Θ。 在人类视觉系统中,该特征是由对暗中央亮周边或亮中央暗周边敏感的神经元来检测的。神经元在被一种颜色所激励的同时,被另一种颜色所抑制,而在感受野的周边则相反。在人类的视皮层中,共有4种空间和颜色秸抗,分别为红/绿、绿/红、蓝/黄和黄/蓝颜色对。 其中,N(?)为特征图的归一化算子;为逐点求和。 关于朝向特征,用θ∈ 0°,45°,90°,135° 这4个方向的Gabor 滤波器对亮度图进行滤波,得到方向图。 其中,O(c,θ)为实Gabor金字塔。 最后,将3种特征进行合并,生成显著图,再根据WTA 机制找到显著图中的兴趣区域,映射回原图,得到目标区域。 2 基于HOG与SVM分类器相结合的行人检测方法 方向梯度直方图[4](Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。通过检测窗口对整幅图像的整体信息转换为组向量数据集, 即
您可能关注的文档
最近下载
- 浙江省宁波市余姚中学2024-2025学年高二上学期10月月考地理.doc VIP
- 建筑装饰行业数字化转型升级分析报告:2025年现状与未来十年展望.docx
- 拼读小能手(彩色版).pdf VIP
- 国际投资(经管专业)全套教学课件.pptx
- 进化生态学课程-康乐讲授-生态基因组学.pdf VIP
- 标准图集-17J008 挡土墙(重力式、衡重式、悬臂式) 无水印.pdf VIP
- 20220104-兴业证券-高频漫谈.pdf VIP
- 变频器基础知识培训ppt课件完整版.pptx VIP
- 新能源运营商行业深度:新能源全面入市,三大压制因素释放绿电迎反转.pdf VIP
- T CRHA 035—2024 化疗所致周围神经病变的评估技术规范.pdf VIP
文档评论(0)