- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于MapReduceGA―BP神经网络算法并行化设计及实现
基于MapReduceGA―BP神经网络算法并行化设计及实现
摘 要:为提高BP神经网络算法的运行效率,利用遗传算法和并行编程思想,提出了Hadoop平台下基于MapReduce的遗传算法优化BP神经网络的并行化设计及实现方法。利用遗传算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现算法的并行化处理,解决BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用Caltech 256图像数据集,与传统的串行遗传算法优化BP神经网络算法实验对比,验证了并行化GA-BP神经网络算法的优越性。
关键词:遗传算法;BP神经网络;MapReduce并行编程模型;并行化设计
DOIDOI:10.11907/rjdk.171303
中图分类号:TP312
文献标识码:A 文章编号:1672-7800(2017)007-0040-04
0 引言
BP(Back Propagation)神经网络是一种多层前馈型神经网络,是一种通过不断修改各层神经元之间的连接权值以及各神经元的阈值,以使网络输出不断逼近期望输出的学习过程[1]。由于它具有很强的泛化能力,并可实现任何复杂程度的非线性映射关系,因此在很多领域得到了广泛应用[2]。然而,BP神经网络算法是基于函数误差梯度下降的思想,不具备全局搜索能力;而且,网络各层之间的连接权值和神经元的阈值在初始训练时是0~1的任意值,这会导致算法收敛速度慢,而且不一定得到最优解。近年来,学者们先后提出一些改进的算法来优化BP神经网络的初始权值和阈值,如遗传算法[3]、粒子群算法、萤火虫算法[4]等。然而,伴随着大数据时代的到来,样本规模愈来愈大,上述传统的串行算法不仅存在硬件支撑瓶颈的问题,而且算法训练时间会变得很长,系统效率明显下降。目前,算法的并行化设计受到广泛关注。郑晓薇等[5]在MPI集群环境下设计了一种多BP神经网络并行集成模型,实现了图像的多语义分类,实验效果良好。刘晶[6]在PVM并行环境下,对大型矩阵运行进行了并行处理,有效降低了矩阵运算的耗时。但是,基于MPI和PVM的并行设计需要开发者对计算机硬件体系结构有较清晰的了解,并且各节点间通信耗时较大,实现也较困难[7]。而近年流行起来的Hadoop平台下的MapReduce框架是一种面向分布式环境的并行计算模式,它向开发人员提供了完整的编程接口,并不需要开发者了解计算机的体系结构,因而逐渐成为当前算法并行化设计的研究热点[8]。针对上述问题,本文提出一种GA-BP神经网络的并行算法,并将其应用于图像分类问题中。该算法在MapReduce并行编程模型下设计并行处理机制,使用遗传算法(Genetic Algorithm,GA)优化BP神经网络的初始权值和阈值,再使用不同的优化后的多个并行BP神经网络训练采用不同的样本集,既保证了BP神经网络能获得最优解,又加快了网络收敛速度,而且在有效降低样本多样性和复杂性对BP神经网络性能影响的同时,大大缩短了训练时间。
1 GA-BP神经网络算法
BP神经网络算法具有很强的自学习和自适应能力,能够很好地解决非线性映射问题,但因其初始权值和阈值的任意性,导致网络收敛速度慢,并且不一定能获得最优解。因此,有必要对BP神经网络的初始权值和阈值进行优化。遗传算法是一种源于生物进化的智能优化搜索算法,因其设置参数少、收敛速度快,且在计算精度要求时,计算时间少、鲁棒性高、易于实现等特点而得到广泛应用。将遗传算法引入BP神经网络中,优化BP神经网络的初始权值和阈值,将很好地解决BP神经网络由于初始权值阈值的任意性而造成的一些缺陷。其算法分为遗传算法优化阶段和BP神经网络训练阶段。
1.1 遗传算法优化阶段
(1)种群初始化。个体采用实数编码,由BP神经网络输入层与隐含层的连接权值、隐含层阈值、隐含层与输出层的连接权值、输出层阈值4部分组成。
(2)适应度函数确定。根据个体得到BP神经网络的初始权值和阈值,用训练样本训练BP神经网络后预测系统输出,将预测输出和期望输出之间的误差绝对值和E作为个体适应度值
(6)更新适应度值并判断是否结束迭代,产生BP神经网络的最优初始权值和阈值。
1.2 BP神经网络训练阶段
(1)网络初始化。根据样本特征确定网络结构、期望输出、学习速率,接收遗传算法优化得到的最优解个体作为网络的初始权值和阈值。
(2)输入训练样本,计算网络各层输出。
(3)计算网络学习误差。
(4)修正各层连接权值和阈值。
(5)判断误差是否满足期望的要求或训练达到设置的迭代次数,如满足条件,则训练结束,否则,继续迭代学习。
2 GA-BP神经
您可能关注的文档
- 基于LBS网络窄告发展现状及趋势.doc
- 基于LCA废旧资源循环利用节能减排效果评估模式与方法研究.doc
- 基于LCC变压器类设备报价体系构建研究.doc
- 基于LCC理论设计阶段造价控制.doc
- 基于LCC电力企业设备大修技改项目造价管理研究.doc
- 基于LCC风景区新能源路灯选择.doc
- 基于LCL滤波三相电压型逆变器.doc
- 基于LCL滤波器船舶轴带发电机PWM整流器.doc
- 基于LCQTOFMSMS技术分析不同产地杜仲差异化学成分.doc
- 基于LCTF成像和ABS算法小白菜光谱特征波段提取研究.doc
- 《GB/T 46383.302-2025电气运输设备 第3-2部分:载物电气运输设备移动性能测试方法》.pdf
- GB/T 46383.302-2025电气运输设备 第3-2部分:载物电气运输设备移动性能测试方法.pdf
- 中国国家标准 GB/T 46383.302-2025电气运输设备 第3-2部分:载物电气运输设备移动性能测试方法.pdf
- 《GB/T 31270.7-2025化学农药环境安全评价试验准则 第7部分:生物富集试验》.pdf
- GB/T 31270.7-2025化学农药环境安全评价试验准则 第7部分:生物富集试验.pdf
- 《GB 5135.2-2025自动喷水灭火系统 第2部分:湿式报警阀、延迟器、水力警铃》.pdf
- GB/T 19412-2025蓄冷(热)空调系统的测试和评价方法.pdf
- 《GB/T 19412-2025蓄冷(热)空调系统的测试和评价方法》.pdf
- 中国国家标准 GB/T 19412-2025蓄冷(热)空调系统的测试和评价方法.pdf
- GB/T 46611-2025电光调制器用铌酸锂单晶薄膜.pdf
原创力文档


文档评论(0)