基于LeNet5算法交通标志识别.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于LeNet5算法交通标志识别

基于LeNet5算法交通标志识别   【摘 要】交通标志的识别是辅助驾驶系统和无人驾驶系统中非常关键的步骤,是指将包含交通标志的待识别区域作为输入(我们在检测步骤中所得到的一组感兴趣区域),输出其交通标志的小类(如限速60公里/小时,禁止停车等),以得到人们所知道的具体含义。   【关键词】LeNet5;卷积神经网络;交通标志识别   一、交通标识识别方案的设计   卷积神经网络(convolutional neural network, CNN)[126]由LeCun等人提出,最早应用于手写数字的识别,且于2012年在ImageNet分类任务上取得了突破性的进展[127]。目前,卷积神经网络已成功应用于简单笔划识别[128]、交通标志识别[58,129]、以及相机定位[130]等多个领域。   卷积神经网络最显著的特点在于可以直接采用图像进行输入,能同时进行特征和分类器的学习,避免了传统识别算法中显式的、复杂的特征提取过程,隐式的从训练数据中进行学习。Giresan等人赢得GTSRB第二轮比赛采用的多列深度卷积神经网络(multi-column deep neural network, MCDNN)[53]包含了三个卷积层,三个最大池化层以及两个全连接层。鉴于卷积神经网络如此优秀的图像识别性能,本文采取LeNet5卷积神经网络来进行交通标志识别。   二、LeNet5卷积神经网络的算法流程   (一)交通标志识别算法的流程   交通标志识别算法流程:输入图像、预处理、特征提取、分类、输出图像等几个关键步骤。在实际的交通环境中,交通标志可能收到各种不利的外部因素影响而难以分辨,如:光线变化,位置的倾斜,风吹雨淋之后的褪色,路边树木的遮挡,这对计算机来说是十分致命的。同时在检测中,也会因算法的不理想而产生的误检、漏检、检测区域偏差等情况,难以实现百分之百的检测和完美的定位,因此我们首先需要对我们检测所得到的一组感兴趣区域做图像的预处理,来提高识别与分类的准确性。   经过图像预处理之后,我们如果直接进行分类识别,会发现通常结果都不会很好,这是因为我们所拍摄的图像中会有很多噪声,这些噪?人眼可以控制忽略,而计算机却不能,所以通过特征映射使得同类型的数据在新的特征空间更加相近,也加大了不同类型数据的区分度,让计算机可以更加准确的判断,排除一些图像平移,形变,缩放的适应性。   这之后我们就将已完成的训练和测试数据按路径输入,同时改变输出种类为43。得到的损失图像如4.1所示。   三、实现与分析   (一)GTSRB数据集   在2011年IJCNN组织了一次交通标志识别竞赛,并与同时公布了GTSRB数据集。该数据集是从德国真实的交通环境中拍摄采集,一共包含4大类(禁令标志、警告标志、指示标志、其他标志)43小类。整个数据集包含了51839幅交通标志图像,其中训练集39209幅,测试集12630幅图像,识别数据集GTSRB每张图像上只有一个交通标志,相当于我们检测部分提取出的每一个感兴趣区域。   (二)运用LeNet5进行交通标志识别   在本文中,主要目的是运用LeNet5实现对GTSRB数据集的交通标志分类,同时了解卷积神经网络的结构及性能,独立训练了一个CNN。   GTSRB数据集中的标志通过颜色特征和形状特征我们将其分为了6大类,统计见表3.1,其中每一类都有自己的特点,例如:限速标志为圆形,红色边框,白色背景,中间为数字;解除禁止为圆形,黑色边框,白色背景,画有黑色斜线等。所以在大类之间的特点差异较大,具有较好的分辨性,但是难点在于每个小类的细分,他们的差别非常小,例如限速60公里/小时和限速80公里/小时,只差了一个数字而6和8又只差了一笔,如图3.1所示。卷积神经网络需要能够分辨这些微小的差别,才能够得到我们所需要的准确率。   (三)图像预处理   根据网络的要求,我们将数据集中的图像大小首先统一缩放到32×32。因为从原始图像中提取的感兴趣区域可能会受到各种不利因素的影响,所以现如今人们都采用了以下几种预处理算法,结果如图3.2所示。图中第1列为原始图像,第2列为灰度图,第3列到第6列分别为采用CLAHE、直方图均衡化、对比度调整以及图像锐化算法处理后的结果。   本文主要目的为实现LeNet5网络在交通标志牌中的运用,为了尽可能减少实验所需要的时间,所以采用了未经处理的原图像作为输入,仅将图像缩放为网络所需大小32×32,以此来判断是否需要做其他预处理来提高准确率。   四、实验结果与分析   首先编写了一套Python代码,用来随机选取训练集的20%进行测试(7841张),另外80%用于训练(31368)。这样做的好处是我们每次的训练和测试都不相同,提高了随机性。

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档