- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于人工智能与智能手机混凝土裂纹检测
基于人工智能与智能手机混凝土裂纹检测
摘 要:近年来,伴随着互联网技术的不断提高及相关硬件的支持,人工智能技术得到快速发展,也为大数据处理和应用提供了基础。同时,智能手机的普及也为采用众包模式进行大数据收集提供了极大的便利。基于此,文中提出了将人工智能与智能手机相结合,利用智能手机进行混凝土裂纹图片收集,再利用人工智能深度学习中的卷积神经网络进行图片中的裂纹识别和定位,达到裂纹检测的目的。最后提出了基于人工智能与智能手机的混凝土裂纹检测的众包模式,调动公众来收集混凝土裂纹图片大数据,充分利用智能手机与人工智能技术的优势,使得混凝土裂纹图片大数据的收集与裂纹检测成为可能。
关键词:人工智能;智能手机;卷积神经网络;裂纹;众包
中图分类号:TP368.5;TU317 文献标识码:A 文章编号:2095-1302(2017)08-00-04
0 引 言
在混凝土结构的服役过程中,裂纹是一种常见的损伤形态[1]。目前,在实际工程中,混凝土裂纹主要还是依靠专业人员定期到现场进行人工测量,费时费力。因此,发展基于裂纹图片处理的裂纹损伤检测方法十分必要。国内外许多学者也进行了相关研究,主要采用图像处理的方法。主要的研究结果可以分为两类,一类是对于图片中的裂纹进行识别,即将图片中的裂纹从背景中分离出来,这需要较好的图片预处理技术[2],有的则利用边缘检测等技术[3-5],在真实混凝土上进行了验证[6],而无人机也被应用于混凝土裂纹照片的采集[7]。另一类是对图片中裂纹宽度、角度等特征进行提取,这些方法分为全自动[8-11]与需要人工参与[12]。但均利用特定的技术,对特定图片背景中的混凝土裂纹进行识别和特征提取。然而,由于图像处理方法是针对图像像素的操作,图片中的背景,尤其是光照和噪声的干扰,将会很大程度上影响裂纹的识别效果,因此发展其它混凝土裂纹检测方法十分必要。
随着互联网技术的发展,大数据时代已经到来,面对海量数据,人工智能也越来越受到人们的重视。深度学习作为人工智能的一个分支[13],近年来取得了很大进展。深度学习的一个重要应用是利用卷积神经网络进行图片分类[14]。卷积神经网络与普通人工神经网络的最大区别在于具有进行卷积操作的卷积层,利用卷积操作实现图片的特征提取。
智能手机已成为当前最为普遍的通讯工具,其软件和硬件已经十分成熟,同时智能手机也内置了存储、传感、通讯及计算等功能。目前,智能手机已应用在人体健康监测[15]、军事[16]、交通[17]及结构健康监测[18]等领域。选择智能手机,采用众包模式进行混凝土裂纹图片大数据的收集完全可行。
1 利用卷积神经网络进行混凝土裂纹检测概述
在利用卷积神经网络进行混凝土裂纹检测时的流程图如图1所示。首先对智能手机收集到的原始图片进行人工分割,将分割之后的小图片分为无裂纹和有裂纹两类,将这些分好?的小图片作为训练样本来训练卷积神经网络模型,之后利用训练好的分类器以及一种窗口滑移技术,将一张大的混凝土表面图片中的裂纹识别并定位出来。
2 卷积神经网络检测混凝土裂纹实验
本文采用经典的深度学习框架――Caffe来完成模型的训练[19],使用Caffe中的AlexNet模型[20]对其进行微调,修改输出类别,将训练分类结果改为两类。
2.1 整体架构
图2所示为混凝土裂纹检测卷积神经网络模型训练的流程,修改后的模型共有8层,前5层是卷积层,后3层是全连接层。模型中选用了非线性激活函数ReLU,池化操作时采用最大池化 (MAX pooling),同时进行了局部响应归一化(LRN)操作以及避免过拟合的Dropout技术。卷积层中的1、2层依次进行卷积、池化以及归一化操作,3、4卷积层则只进行卷积操作,第5个卷积层进行卷积和池化操作,第6、7层在全连接后进行了Dropout操作,第8层进行全连接,然后输出为融合了分类标签的Softmax。
卷积神经网络在训练时,输入图片经过卷积、池化等一系列操作后,数据的尺寸也会发生变化,在训练时,设置caffe中的crop_size为227,将图片进行裁剪后作为模型的输入数据。表1列出了输入数据在本文卷积神经网络中训练时的尺寸变化。表2所列为各卷积、池化时的操作参数。
2.2 卷积
卷积是卷积神经网络中较为核心的操作,它是指将输入图像中的像素在小区域中进行加权平均,然后在对应的位置输出,该小区域叫做卷积核或滤波器。卷积核的大小决定了进行卷积操作时的区域大小,卷积核中的参数称为权值,权值大小决定了卷积核覆盖的图像区域对应的像素点对卷积结果的贡献大小,权值越大,贡献越大。图3表示了输入图像大小为5×5,卷积核大小为3×3,步长为1,偏置为0的一个卷积过程。
2.3 池
原创力文档


文档评论(0)